Возврат   ТелекомВести
  
Предыдущая новость25 июня 1997 г.


Русский DataBlade - для программиста лучше нет


24 июня ("Сети")
Сегодня, когда в США состоялась презентация долгожданной СУБД Oracle8 (в Usenet ее уже прозвали Oracle Late), а до российского старта этой системы осталась еще неделя, компания РЕДЛАБ представила DataBlade-модуль "Русский текст" к главному ее конкуренту, выпущенному на рынок несколько месяцев тому назад, - СУБД Informix Universal Server.

Первый созданный в России DataBlade-модуль "Русский текст" добавляет серверу СУБД возможности хранения и управления русскоязычными документами, а также полнотекстового поиска в них. По заявлению представителей РЕДЛАБ и Informix, Universal Server является на сегодня единственной СУБД (надо полагать имелись в виду "иностранки"), предоставляющей полную поддержку русского языка.

Возможность хранения, поиска и доступа к текстовым документам (неструктурированным данным) является одним из признаков объектно-реляционных СУБД, к классу которых относится Informix Universal Server. Сегодня все крупнейшие производители СУБД заявляют о поддержке работы с документами. При этом задача полнотекстового поиска решается, как правило, внешними по отношению к серверу БД приложениями, что значительно снижает его производительность. Посредством же DataBlade-модуля "Русский текст" морфологический анализ и индексирование русскоязычных текстов полностью интегрируется в Informix Universal Server. Как сказал директор РЕДЛАБ Руслан Смелянский, "Русский текст" за одну минуту может осуществить морфологический разбор "Войны и мира".

Важной особенностью Universal Server является поддержка доступа к хранимым в базе обычным, неструктурированным текстовым и специфическим данным (типа геопространственные данные, аудио- или видеоклипы) через Web с помощью стандартного браузера. Поиск документов осуществляется по отдельным словам, с использованием логических операторов AND, OR и NOT (поскольку, как утверждает разработчик, "Русский текст" настраивается на лексику заказчика, наверное, не составит труда заменить их на И, ИЛИ, НЕ), по заданному шаблону или по нечетким критериям, по нескольким словам с применением операторов расстояния и соседства. В ходе демонстрации продукта на базе по российскому законодательству мы попросили сотрудников РЕДЛАБ найти документы, повествующие о "бюджетных организациях". Система выдала нам тексты, где встречаются сочетания не только типа "бюджетные организации", но и, что нас немного поразило, "в организациях, в том числе бюджетных".

Поиск слов на латыни (вроде DataBlade) в тексте на русском языке, продемонстрировать нам не смогли, поскольку база российского законодательства их не терпит. Однако Руслан Смелянский заверил, что подобный поиск осуществлять можно и даже двумя способами: во-первых с помощью автоматического переключения с "Русского текста" на его, например, англоязычного собрата; во-вторых, без переключения. Но в этом случае "Русский текст" будет воспринимать искомое слово как незнакомое, поэтому при его наличии, обнаружит его только в указанной словоформе. Заданные русские слова новый DataBlade ищет во всех возможных словоформах, т. е. во всех падежах и числах.

В заключение следует отметить, что хотя презентация первого российского DataBlade-модуля осуществлялась в рамках совместной акции РЕДЛАБ и Informix, последняя его еще не признала полностью "за своего", так как по правилам этой компании, каждый модуль, претендующий на признание главой семейства, должен пройти сертификацию. Эта процедура в настоящее время осуществляется и, как выразился представитель Informix Говард Залкин, завершится "не позже конца третьего квартала".

Укрощение объектов

Производитель СУБД Методы
СА OpenIngres и "Jasmine" (объектная СУБД в стадии бета-тестирования) Использование OpenIngres для реляционных данных, а Jasmine в истинно объектно-ориентированных приложениях, связанных с Web. SQL-классы поддерживают задачи типа осуществления транзакций между обеими СУБД
IBM DB2 Universal Database (выпуск запланирован на сентябрь) Реляционная СУБД DB2 будет работать с новыми типами данных благодаря Extenders - расширительным программным модулям, которые описывают эти типы и возможные операции с ними
Informix Informix Universal Server (доступен) Модули DataBlade - для каждого типа данных свой - внедряются непосредственно в ядро РСУБД
Oracle Oracle8 (представлена 24 июня) Расширение к системе типов данных Oracle позволяет пользователю описывать новые типы, а механизм Object Views синтезировать объекты из выбранных строк и столбцов таблицы и определять их поведение
Sybase Sybase Adaptive Server (доступен) Разработанные Sybase и ее партнерами раздельные хранилища данных оптимизированы под конкретный тип данных; Adaptive Server координирует взаимодействие приложений с этими хранилищами

Источник : Network World