製品・サービス

libTextConv (テキストコンバータライブラリ)

English

libTextConv とは

libTextConv は Microsoft Word や Excel などのバイナリファイルをプレーンテキストに変換する C 言語用のライブラリです。 文書管理、検索システムなどの応用アプリケーションへの適用や、メールシステムと組み合わせての添付ファイル処理など、 さまざまな利用が考えられます。

導入事例

Web Mail の老舗 トランスウエア様で、 各種メール製品に libTextConv が採用されています。 導入事例の詳細は こちら でご覧いただけます。


SRA が提供しているメールアーカイブ製品 MailDepot では、 添付ファイルの解析に libTextConv が採用されています。

弊社の全文検索機能を搭載したメールソフト製品 Sylpheed Pro では、 添付ファイルからのテキスト抽出処理に libTextConv を利用しています。

特長

対応フォーマット

アプリケーション ファイル形式 (拡張子)
Microsoft Office 97 〜 2003
(Word、Excel、PowerPoint)
.doc .xls .ppt
Microsoft Office 2007 / 2010
(Word、Excel、PowerPoint)
.docx .xlsx .pptx (OpenXML)
OpenOffice.org 2.x / 3.x
(Writer、Calc、Impress)
.odt .ods .odp (OpenDocument)
OpenOffice.org 1.x
(Writer、Calc、Impress)
.sxw .sxc .sxi
PDF .pdf
一太郎 (Ver.8 以降) .jtd
RTF (ワードパッド等) .rtf
HTML※1 .html .htm
SGML※1 .sgml
XML※1 .xml
各種アーカイバ .zip .tar .tar.gz .gz .lzh※2 .tar.bz2※3
※ 1
テキスト要素のみ出力されます。また、文字コードは変換されません。
※ 2
lzh ファイルの展開には同梱されている 7-Zip が必要です。
※ 3
tar.bz2 ファイルの展開は自動判別による対応となります。

対応 OS

※ その他 Linux については今後対応予定です。
※ 上記以外の OS についてはお問い合わせください。

libTextConv の性能

libTextConv は高速動作が特徴です。以下にサンプルドキュメントでの性能テスト結果を示します。

  • テスト方法:
    各フォーマットのドキュメントを libTextConv で1000回繰り返しテキスト抽出し、1回あたりの実行時間を計測。
  • 実行環境:
    Intel Core 2 Duo E6600, RAM 3.2GB
  • バージョン:
    libTextConv 2.0.0
MS
Office
.doc (825KB, 69P) 2.76 msec
.xls (91KB, 18P) 0.92 msec
.ppt (360KB, 16P) 3.06 msec
OOo
2.0
.odt (399KB, 69P) 8.24 msec
.ods (23KB, 18P) 6.91 msec
.odp (201KB, 16P) 1.40 msec
pdf .pdf (341KB, 16P) 12.67 msec

※ 数値は、1ファイルごとの抽出処理時間 (単位: ミリ秒)です。

バージョン情報

ダウンロード

libTextConv の PHP 拡張モジュールのソースコードがダウンロードできます。

価格

Linux / Solaris 版

製品価格 + 初年度保守次年度以降保守
サーバライセンス (1 サーバあたり) 315,000 円 (税込)47,250 円 (税込)
開発用サーバライセンス (1 サーバあたり) 157,500 円 (税込)47,250 円 (税込)

Windows 版

製品価格 + 初年度保守次年度以降保守
サーバライセンス (1 サーバあたり) 315,000 円 (税込)47,250 円 (税込)
開発用サーバライセンス (1 サーバあたり) 157,500 円 (税込)47,250 円 (税込)

上記は一般価格であり、製品組み込みの ISV 価格は、 お問い合わせのページ よりお問合せください。

※ libTextConv は SRA OSS, Inc. 日本支社が開発 / 販売しています。