SRA OSS

SRA OSS、MS Office ファイルからテキストを抽出するlibTextConv の V2 を発売

2011 年 8 月 24 日

SRA OSS, Inc. 日本支社

SRA OSS, Inc. 日本支社 (東京都豊島区、取締役支社長: 石井 達夫、以下 SRA OSS) は、MS Office, OpenOffice.org, PDF などのファイルからテキスト抽出する「libTextConv」の新版、V2 を発売いたしました。

V2 では、新たな対応フォーマットとして、一太郎、RTF、HTML / SGML / XML に対応しました。

また、PHP言語から直接 libTextConv の機能を呼び出せる拡張モジュールを追加し、PHP からの利用がより簡単になりました。

更に、新しいプラットフォームとして Red Hat Enterprise Linux 6 に対応しています。

これにより、libTextConv は下記のファイルフォーマットに対応いたします。

ファイル形式 拡張子
Microsoft Office 97 ~ 2003 .doc .xls .ppt
Microsoft Office 2007 / 2010 .docx .xlsx .pptx(OpenXML)
OpenOffice.org 2.x / 3.x .odt .ods .odp(OpenDocument)
OpenOffice.org 1.x .sxw .sxc .sxi
PDF .pdf
一太郎(Ver.8 以降)

.jtd
RTF(ワードパッド等) .rtf
HTML .html .htm
SGML .sgml
XML .xml
各種アーカイバ .zip .tar .tar.gz .gz .lzh .tar.bz2

提供形式は、コマンドラインツール、C 言語ライブラリ、PHP 拡張モジュールとなります。

対応プラットフォームは、Linux, Solaris, Windowsです。

libTextconv は、製品や応用アプリケーションに組み込んで利用することを想定しています。

libTextConv を導入することにより、様々な形式のファイルからテキスト部分が抽出されるので、メールの添付ファイルの解析に利用したり、ドキュメント管理システムの全文検索機能を提供することが可能になります。

2007 年の発売開始以降、トランスウエア様のメールアーカイブ製品であるActive! Vault( -> 導入事例詳細 )や、 株式会社 SRA のメールアーカイブ製品であるMailDepotなどに 組み込まれて利用されています。

libTextConv 紹介ページ

libtextconv(テキストコンバータライブラリ):

https://www.sraoss.co.jp/prod_serv/package/libtextconv/

SRA OSS について

SRA OSS は、OSS (オープンソースソフトウェア) の普及と発展を目指し、国内独立系 SI ベンダーである 株式会社 SRA の 100% 子会社として設立されました。

本社は米国カリフォルニア州におき、ワールドワイドな OSS ベンダーを目指しています。

日本においては特に PostgreSQL を中心としたOSSのサポート、プロダクト販売、 コンサルティング、トレーニング事業を中心に展開しています。

本件に関する報道お問い合わせ先

SRA OSS, Inc. 日本支社

マーケティング部 稲葉

Tel: 03-5979-2701

E-mail: pub@sraoss.co.jp

URL: https://www.sraoss.co.jp

※本プレスリリースに記載のある会社名、製品名は、各社の登録商標または商標で、 それぞれの所有者が商標権を保持しています。

facebook ブログ Youtube SRA Group
製品・サービスに関するお問い合わせ

メールフォーム

 

03-5979-2701