Логин:
Пароль:

Работа №1510
Название работы
Восстановление логической структуры документа по его физическому представлению для автоматизированного наполнения веб-ориентированных информационных систем
Автор работы
Филонов Михаил Александрович
Дата начала работы Дата окончания работы
2009-08-20 2010-09-10
Аннотация
Объект исследования (разработки) – Алгоритмы восстановления логической структуры и метаинформации документов по их физической модели; алгоритмы обработки и трансформации логической структуры документа в объектную метамодель документа. Цель работы - разработать инструменты и алгоритмы для решения задачи автоматизированного переноса оцифрованных документов в веб-ориентированные информационные системы. Ожидаемые научные результаты – программный комплекс, производящий пакетную обработку оцифрованных документов и их добавление в веб-ориентированные информационные системы
Тип НИР Источник финансирования Объем финансирования Вид работы
ФЦП 1006600 Федеральное агентство по образованию Прикладная
Промежуточный реферат №1
Цель работы - разработать инструменты и алгоритмы для решения задачи автоматизированного переноса оцифрованных документов в веб-ориентированные информационные системы. Методы, используемые в работе: методы системного и объектно-ориентированного программирования, проведение экспериментов. Используемые инструменты: реферативные базы данных научных публикаций, парк персональных компьютеров и их программное обеспечение, пакеты программного обеспечения GNU apache, программный комплекс VDOM Server, ghostscipt, redmon, qt, innosetup, высокопроизводительное серверное оборудование, интернет базы данных международных патентов, ГОСТ Р15.011-96, ГОСТ 7.32-2001. В рамках выполнения 1 этапа работы были получены следующие результаты: Предложен универсальный расширяемый язык описания документов, который предоставляет возможность описывать документ на различных семантических уровнях, включая промежуточные этапы восстановления. Разработан язык описания наборов правил восстановления документа, представленного в виде физической модели. Разработана метамодель представления документов в веб-ориентированных информационных системах, которая реализует компонентный подход к построению структуры веб-сайта. Реализован драйвер виртуального принтера, который может принимать входные данные из любых прикладных программ и добавлять документы в веб-ориентированных информационные системы. Разработана поисковая система по научным материалам в сети Интернет для создания и наполнения тематических баз данных. Произведено экспериментальное тестирование предложенных языков и моделей на разработанных системах. Было произведено исследование применимости языка описания документа и языка описания эвристик для формальной записи уже существующих подходов к восстановлению физической модели документа. ПРИЛОЖЕНИЕ: Отчет о патентных исследованиях.
Инвентарный номер отчета (ИК): 02201050222 Дата регистрации ИК: 2010-01-15
Заключительный реферат
Цель работы - Разработать инструменты и алгоритмы для решения задачи автоматизированного переноса оцифрованных документов в веб-ориентированные информационные системы Методы системного и объектно-ориентированного программирования, проведение эксперимнетов Реферативные базы данных научных публикаций, парк персональных компьютеров и их программное обеспечение, пакеты программного обеспечения GNU apache, программный комплекс VDOM Server, ghostscipt, redmon, qt, innosetup. Высокопроизводительное серверное оборудование, Интернет база данных международных патентов и ГОСТ Р 15.011-96.ГОСТ 7.32-2001 «Отчет о научно-исследовательской работе. Структура и правила оформления». В рамках выполнения 2 этапа работы были получены следующие результаты: Разработан алгоритм и эвристики восстановления высокоуровневых объектов из потока печати и оцифрованных документов. Разработан алгоритм и эвристики для восстановления метаинформации оцифрованных документов в виде программного комплекса. Реализована объектная метамодель веб-оринетированной информационной системы. Разработан транслятор из объектной метамодели в форматы данных существующих веб-серверов. Проведены тестовые испытания алгоритмов восстановления логической структуры и метаинформации документа. Материалы работы опубликованы в виде докладов и статей.
Инвентарный номер отчета (ИК): 02201161122 Дата регистрации ИК: 2011-10-03
Заказчик
Федеральное агентство по образованию, ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы» Мероприятие 1.3.2 «Проведение научных исследований целевыми аспирантами» Конкурс НК-289П «Проведение поисковых научно-исследовательских работ по направлению «Обработка, хранение, передача и защита информации» в рамках мероприятия 1.3.2 Программы» , ГК № П1044 от 20 августа 2009 г.
ГРНТИ УДК Инвентарный номер Госшифр Госконтракт Договор
50.01.00 ( АВТОМАТИКА. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА. Общие вопросы автоматики и вычислительной техники. . )
50.41.25 ( АВТОМАТИКА. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА. Программное обеспечение вычисли-тельных машин, комплексов и сетей. Прикладное программное обеспечение. )
20.23.00 ( ИНФОРМАТИКА. Информационный поиск. . )
004; 681.5; 502830 П1044
Ключевые слова
обработка документов, полнотекстовый поиск, метаинформация, электронные библиотеки, виртуальная печать, информационные системы
Предполагаемый результат работы
Отчет
Организации соисполнители
Государственный учет результатов НИОКР в БД РНТД Минобрнауки РФ
Получить полный доступ
Основание к регистрации темы (электронный вариант)
Только для служебного пользования
   
2007 © ОНТИ НУ ТГУ
E-mail: onti@sun.lib.tsu.ru
Тел: 52-76-99