парсеры
Релиб
Форумы       Участники    Календарь    Кто он-лайн?
Добро пожаловать, гость ( Вход | Регистрация )
        



парсеры Expand / Collapse
Автор
Сообщение
19.03.2006 13:49
Supreme Being

Supreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme Being

участник
Last Login: 02.02.2008 12:03
Сообщ.: 143, Visits: 1 404
Доброго времени !

Огромная просьба ! Очень нужны парсеры [italic] doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps[/italic] для разбора текста. Исходники или утилиты, хорошо бы конечно с документацией.
Или же конвертеры из одного формата в другой.
Времени писать свои практически нет.

Пожалуйста, если кто знает, киньте ссылки.


Men in black
Сообщ. #893197
22.03.2006 3:58


Supreme Being

Supreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme Being

участник
Last Login: 23.04.2007 23:36
Сообщ.: 1 541, Visits: 16 997
Какого рода разбор текста нужен-то?

А вообще, doc, rtf, txt неплохо разбираются Вордом, ppt - PowerPoint'ом, для html есть библиотека с поддержкой оъектной модели (прямо в винде), с pdf TMS FlexCel Studio умеет работать. chm - тот же html, только упакованный, для распаковки есть утилиты (например, плагин к Total Commander), наверняка и исходники какие-то найти можно. Для hlp тоже что-то похожее было.
Вот для tex и ps - не знаю...



Сообщ. #893344
24.03.2006 22:36
Supreme Being

Supreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme BeingSupreme Being

участник
Last Login: 02.02.2008 12:03
Сообщ.: 143, Visits: 1 404
Спасибо что откликнулись.

С большинством вопрос уже решён, осталось найти конвертер hlp,chm в doc, или же спецификацию файлов.
Исходники бы ещё, наглец я - но что поделаешь.


Men in black
Сообщ. #893636
« пред. тема | след. тема »


Эту тему читают Expand / Collapse
Посетители: 0 (0 гостей, 0 участников, 0 скрыт.участников)
Сейчас нет участников, просматривающих тему.
Модераторы: Alexey, boombastik, bazile, pl

Время GMT +3:00, Сейчас 4:41