Виток-TEXT - Система для поиска в неструктурированной текстовой информации
| Артикул | 029139 |
| Компания TINVEST дилер | Норси-Транс |
| Наличие | Под заказ |
|
Цена
|
По запросу |
Вы можете купить Виток-TEXT - Система для поиска в неструктурированной текстовой информации в интернет-каталоге TINVEST официального дилера Норси-Транс по выгодной цене с доставкой по РФ.
Виток-TEXT - Система для поиска в неструктурированной текстовой информации.
"Виток-TEXT" – специальная поисковая система в неструктурированных текстовых массивах данных. Система предназначена для накопления, анализа и поиска в неструктурированных текстовых данных. Поддерживается большое количество форматов исходных файлов, различные способы поступления данных на обработку. Система сохраняет накопленную информацию, включая различные атрибуты исходных файлов, в собственной БД, оптимизированной для быстрого поиска.
Данная система может применяться для произведения поиска в неструктурированной текстовой информации, накапливаемой различными организациями.
В качестве источников данных могут использоваться:
- Файловая система (директория на диске);
- СУБД MS SQL Server.
У пополняемых источников данных есть функция отслеживания новых файлов, направления их на обработку и ведения учета уже обработанных файлов.
Подробное описание "Виток-TEXT"
Поиск
- Для формирования поисковых запросов разработан язык запросов, поддерживающий логические операторы «И», «ИЛИ», «НЕ», оператор расстояния между словами, оператор отключения морфологии. В качестве элементов запроса могут выступать как обычные слова, так и объекты.
- При поиске значения атрибутов документов могут использоваться фильтры. Примеры фильтров:
- диапазон времени;
- рубрики, темы, тип документа;
- дополнительные атрибуты исходного текста.
- В результате запроса включается фрагмент найденного текста, содержащий вхождение искомых слов, а также сохраненные атрибуты текста. Доступен просмотр полного текста документа с многоцветной подсветкой слов и объектов и возможностью навигации между ними.
Обработка файлов
Система извлекает текст из большого числа форматов файлов:- MS Office: doc, docx, xls, xlsx, xlsm, ppt, pptx, pptm;
- OpenOffice: odt, ods, sxw;
- Прочие: txt, rtf, pdf, html, mht, xml, eml, wpd.
Выполняется обработка содержимого не защищенных паролем архивов (в том числе самораспаковывающихся) форматов rar, zip, gzip, tar, tgz, bz2. Возможна реализация специализированных обработчиков структурированных файлов для извлечения и сохранения сопутствующей информации.
