|
|
|
Supreme Being
      
участник
Last Login: 02.02.2008 12:03
Сообщ.: 143,
Visits: 1 404
|
|
Доброго времени !
Огромная просьба ! Очень нужны парсеры [italic] doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps[/italic] для разбора текста. Исходники или утилиты, хорошо бы конечно с документацией.
Или же конвертеры из одного формата в другой.
Времени писать свои практически нет.
Пожалуйста, если кто знает, киньте ссылки.
Men in black
|
|
|
|
|
Supreme Being
      
участник
Last Login: 23.04.2007 23:36
Сообщ.: 1 541,
Visits: 16 997
|
|
Какого рода разбор текста нужен-то?
А вообще, doc, rtf, txt неплохо разбираются Вордом, ppt - PowerPoint'ом, для html есть библиотека с поддержкой оъектной модели (прямо в винде), с pdf TMS FlexCel Studio умеет работать. chm - тот же html, только упакованный, для распаковки есть утилиты (например, плагин к Total Commander), наверняка и исходники какие-то найти можно. Для hlp тоже что-то похожее было.
Вот для tex и ps - не знаю...
|
|
|
|
|
Supreme Being
      
участник
Last Login: 02.02.2008 12:03
Сообщ.: 143,
Visits: 1 404
|
|
Спасибо что откликнулись.
С большинством вопрос уже решён, осталось найти конвертер hlp,chm в doc, или же спецификацию файлов.
Исходники бы ещё, наглец я - но что поделаешь.
Men in black
|
|
|
|