Приведенные результаты получены по итогам сравнения найденных текстов профессионалом-экспертом. Вычислительные характеристики и архитектура компьютерной технологии смыслового поиска текстовой информации КЛЮЧИ ОТ ТЕКСТА Принципиальной чертой технологии КЛЮЧИ ОТ ТЕКСТА является отсутствие необходимости в семантической информации для смыслового анализа текстовой информации. Видимо, это отражает глубинные свойства человеческой речи как семиотической системы. Оказалось, что если воспринимать текст как бытующий среди других текстов, его семиотические детерминанты могут быть выявлены в результате определенной вычислительной процедуры. Безусловно, представляет интерес вычислительная трудоемкость технологии КЛЮЧИ ОТ ТЕКСТА. Вначале ориентировочные цифры: поиск по образцу с последующим смысловым анализом результатов в 10 Мбайт текстовой информации на современном персональном компьютере с процессором класса Pentium II требует примерно 10–30 секунд работы. Если не использовать для поиска механизмов баз данных, то время поиска растет примерно линейно при росте объема зоны поиска. Иначе ведет себя трудоемкость смыслового анализа текстов, если пытаться оптимизировать режим анализа информации. Такая оптимизация предполагает объединение анализируемых текстов в пакеты с последующим анализом пакета в целом. Выигрыш здесь достигается за счет того, что время, необходимое для создания компьютером структур, используемых для анализа текстовой информации, является выпуклой функцией от числа текстов. Причем, при малом числе текстов оно практически не зависит от их числа. В результате среднее время анализа одного текста при пакетном режиме анализа оказывается значительно меньше, чем время анализа одного отдельно взятого текста. Однако, при значительном росте числа текстов в пакете, трудоемкость растет значительно быстрее, чем линейно. Поэтому заложенная в основание технологии КЛЮЧИ ОТ ТЕКСТА ориентация на параллельные вычисления и работу в распределенных средах хранения данных способна реально обеспечить смысловой поиск и анализ текстовой информации в распределенных электронных библиотеках и информационных ресурсах глобальных телекоммуникационных сетей при применении мощных многопроцессорных сред и супер-ЭВМ.
Приведенные результаты получены по итогам сравнения найденных текстов профессионалом-экспертом.
Принципиальной чертой технологии КЛЮЧИ ОТ ТЕКСТА является отсутствие необходимости в семантической информации для смыслового анализа текстовой информации. Видимо, это отражает глубинные свойства человеческой речи как семиотической системы. Оказалось, что если воспринимать текст как бытующий среди других текстов, его семиотические детерминанты могут быть выявлены в результате определенной вычислительной процедуры.