SRA OSS

SRA OSS が MS Office や PDF からテキストを高速抽出する「libTextConv」の導入事例を公開

2013年10月9日

SRA OSS, Inc. 日本支社

マーケティング部

オープンソースソフトウェアのトータル・ソリューション・サプライヤー SRA OSS, Inc. 日本支社(東京都豊島区、以下SRA OSS)は、 MS Office, OpenOffice.org, PDF などのファイルからテキストを 抽出するライブラリおよびコマンド製品「libTextConv」の導入事例を10月8日に公開しました。

「libTextConv」は、SRA OSS が 2007年から開発・販売を行っており、 株式会社トランスウエア様のメールアーカイブ製品である Active! Vault や 株式会社SRAのメールアーカイブ製品である MailDepot などに採用されています。

【導入事例掲載URL】

株式会社クイック様 libTextConv 導入事例

https://www.sraoss.co.jp/case_study/919/

libTextConvについて

libTextConv は、テキスト抽出のためのコマンドラインツール、C言語ライブラリ、PHP拡張モジュールを提供しています。

Linux, Solaris, Windowsに対応しています。下記のファイルフォーマットに対応しています。

アプリケーション ファイル形式 (拡張子)
Microsoft Office 97 ~ 2003
(Word、Excel、PowerPoint)
.doc .xls .ppt
Microsoft Office 2007 / 2010
(Word、Excel、PowerPoint)
.docx .xlsx .pptx (OpenXML)
LibreOffice 4.x / 3.x
Apache OpenOffice 3.x
OpenOffice.org 2.x / 3.x
(Writer、Calc、Impress)
.odt .ods .odp (OpenDocument)
OpenOffice.org 1.x
(Writer、Calc、Impress)
.sxw .sxc .sxi
PDF .pdf
一太郎 (Ver.8 以降) .jtd
Microsoft Visio (2000以降) .vsd
Lotus 1-2-3※1 .123 .wj1 .wj2 .wj3 .wj4 .wk1 .wk2 .wk3 .wk4 .wks
Lotus Word Pro※2 .lwp
RTF (ワードパッド等) .rtf
HTML※3 .html .htm
SGML※3 .sgml
XML※3 .xml
各種アーカイバ .zip .tar .tar.gz .gz .lzh※4 .rar※4 .tar.bz2※5
※1
日本語、英語のみ対応しています。
※2
英語のみ対応しています。
※3
テキスト要素のみ出力されます。また、文字コードは変換されません。
※4
lzh, rar ファイルの展開には同梱されている 7-Zip が必要です。
※5
tar.bz2 ファイルの展開は自動判別による対応となります。

製品詳細は https://www.sraoss.co.jp/prod_serv/package/libtextconv/

お問い合わせ

SRA OSS, Inc. 日本支社

マーケティング部 担当: 稲葉

Tel: 03-5979-2701

E-mail: pub@sraoss.co.jp

URL: https://www.sraoss.co.jp

※本インフォメーション記載の会社名、製品名は、各社の登録商標または商標で、それぞれの所有者が商標権を保持しています。

facebook ブログ Youtube SRA Group
製品・サービスに関するお問い合わせ

メールフォーム

 

03-5979-2701