Курс: Спецглавы информатики Описание
Введение

Что в курсе изучается

Для кого курс

Как курс читается

Введение

По имеющимся оценкам, в настоящее время объем информации, представленной в цифровом виде, уже значительно превышает объем информации, представленной в виде "твердых копий". Объем цифровой информации продолжает нарастать, превышая на порядки возможности ее чисто человеческого восприятия и усвоения. При оценке  темпов роста объема цифровой информации надо еще учесть, что все это произошло, фактически, за последнее десятилетие, причем характер распространения информации стал глобальным, в основном через Web. В такой ситуации особенно остро стоит вопрос не столько эксплуатации имеющихся информационных систем (ИС), сколько поиска новых приемов и методов представления информации и ее переработки, новых информационных технологий (ИТ).

Возможностей имеющихся ИС заметно не хватает, а предпосылки, на которых они основаны, во многом не отвечают потребностям практики. Общепринятой теории ИС не имеется, а прежние теории баз данных считаются узко направленными и морально устаревшими. Вместе с тем систематическое использование в ИС объектов данных и объектов метаданных требует последовательного установления адекватных моделей вычислений, их реализации в полном объеме, массового применения соответствующих инструментальных средств. Это неотложное требование практики по разным причинам не выполняется. Одна из них -- хронический недостаток специалистов, действительно знающих теорию ИС, умеющих ее развивать и разрабатывать применительно к условиям эксплуатации. В университетах этому не уделяют внимание, все больше переходя на овладение сиюминутными технологиями, знание которых позволяет выпускникам немедленно трудоустроиться и добиваться делового успеха. На это тратятся сотни и сотни часов академических программ, и как бы не замечается, что дальше выпускников с таким багажом ожидает нескончаемое "пожизненное образование" в попытках ухватить детали и особенности усовершенствованных ИТ. Никто и не думает учить принципам, зная которые легко понять все многообразные коммерческие усовершенствования и ухищрения.

Почему это происходит? Причин тому несколько, одна из них -- необходимость наладить систему обучения теории моделей для ИТ и ИС, теории представления предметных областей, методам учета динамики информационных процессов, методам персонификации, специальным логикам частичных (схематических) объектов, конструированию теорий вычислений и абстрактных машин. Принципиальная трудность в том, что систему образования надо строить не теоремно-доказательственным способом, как хорошо умеют учить и учат в чистой математике, а на основе конструктивного подхода, предъявляя реально или потенциально реализуемые вычислительные процедуры. Все это как раз и составляет предмет теории вычислений. Эта "физика" информационных систем и информационных технологий как никогда востребована и должна стать тем базовым образованием, которое столь необходимо выпускникам.  

С развитием информационной инфраструктуры и системы непрерывного образования более, чем когда-либо существует опасность разочарований в формализациях, если только как те, кто получает знания, та и те, кто обучает -- поставляет знания, -- не сумеют ясно и конструктивно увидеть за операторами, преобразованиями и формулами логики ее суть, смысловую сторону и предметное содержание. Особенно остро этот вопрос стоит в области компьютерных приложений в конкретных отраслях знания, когда организация информации, взаимосвязей ее частей и умение обеспечить и организовать доступ к большим объемам фактического хранимого материала либо дают специалисту решающее преимущество, либо сводят на нет многие его усилия.

Именно для тех, кто хочет в разнообразии внешних форм увидеть содержание и суть, которые расположены глубже, и предназначен этот курс. В расширенном варианте курса систематически используется техника семантических рассуждений, основными структурными единицами являются объект данных, объект метаданных и отношение, что особенно важно для работы с электронными формами информации.

Вверх

Что в курсе изучается?

Вот те некоторые вещи, которые, как ожидается, будут изучены (некоторые -- ознакомительно, другие -- углубленно):

  • Что такое синтаксис и что -- семантика? Синтаксис, структура и семантика.
  • Понимание структуры текста/документа: метаданные, правила, умозаключения, работа с ними.
  • Выделение смысла: схемы сокращения, классы, учет контекста, моделирование связей, стилистические варианты.
  • Классификация, извлечение из текста смысла, представление существенного знания.
  • Спецификации: почему схемы сокращения адекватны? почему схемы сокращения неадекватны? как их выбирать? как пересматривать выбранные схемы сокращения на основе проверки их адекватности и/или значимости? как организовать поиск информации и написать запрос? каковы связи с формами и стандартами представления семантической информации?  в чем преимущество XML(S)?  зачем нужен OWL и что такое онтологии?
  • Семантические (смысловые) приложения -- проверка выводимости заключений, проверка значимости аргументации, оценка адекватности формализованного описания фрагмента документа, возможности компьютерной обработки, имеющиеся методы и средства семантического анализа  
  • Состояние исследований, проблематика и перспективы в области/смежных областях знания (например, IBM's Web средства, LSDIS's InfoQuilt и METEOR-S, DAMS-S).
  • Коммерческие технологии, например, Semagix/Taalee, Ontoprise, Cyccorp, Applied Semantics, имеющиеся бизнес-модели и их перспективы:
    - управление содержанием (смыслом) в перспективе,
    - анализ текста, анализ смысла -- трудности и возможные пути их преодоления.
  • Информационные технологии, методв и коммерческие изделия.
  • Состояние исследований: вклад в развитие СИИ, логик, баз данных, семантических сетей, онтологий (их интеграции и интероперабельности), расширение границ применимости семантических сетей (включая моделирование человека-субъекта и принятие решений).

Вверх

Для кого курс (кому этот курс особенно полезен)

В полном объеме -- это продвинутый курс, который идеально походит для аспирантов и соискателей ученых степеней, при подготовке диссертации магистра или бакалавра на втором году обучения. В этом случае курс особенно полезен для развития навыков выполнения научно-исследовательской работы для тех, кто специализируется в области Информационных Систем, Информационных Технологий, Информатики.  Продвинутый курс отлично подходит для тех, кто уже выполнил некоторую часть НИР и желает систематизировать результаты, понять их взаимосвязи, оценить степень полноты фактов, разбить результаты на классы, сопоставить информацию, полученную из разных источников и т.п. Для целей выполнения комплексной НИР студент должен понимать, что он уже должен разбираться в следующих вопросах:

  • базы данных, информационные системы или принципы искусственного интеллекта (к примеру курс по системам управления базами данных, по глобальным информационным системам) либо  иметь опыт работы по созданию значительных схем баз данных и по приложениям с интенсивным обменом данными (скажем, студент специализируется либо в области баз данных/информационных систем, либо в аспектах СИИ/технологиях семантических сетей);
  • начала или полная техника работы в Web, включая HTML (умение построить домашнюю страницу), XML (общего знакомства может хватить для подготовленного студента;
  • некоторую программистскую подготовку, минимальное знание Java и какого-либо языка сценариев.

В базовом или сокращенном объеме курс может расцениваться как ознакомительный со всеми этими принципами. В таком случае он может служить отличным вводным курсом в проблематику информационных технологий для студентов гуманитарных специальностей. В ходе его изучения приобретается навык в проведении строгих рассуждений и анализа их значимости, умение связывать интуитивные знания с их формальными представлениями, умение анализировать структуру документов и находить связи их отдельных частей с оценкой противоречивости.

В особенности приятно работать со студентами, которые мыслят нетривиально и изобретательны, а также с теми, кто имеет серьезную установку на научно-исследовательскую работу. Конечно, курс удобен и для тех, кто ожидает хорошо структурированный учебник, по которому можно все усвоить. Кончено, лучше всего материал увязывать с постоянно растущим и нестабильным объемом результатов в направлении семантического анализа и представления информации, стандартов W3C, новых информационных технологий и программных средств. Весь этот вкус выполнения живого исследования с помощью логики хотелось бы во время занятий ощущать вместе со студентами.

Вверх

Как курс читается?

Организация учебного процесса заключается в следующем:

  • лекции, которые читаются в аудитории,
  • выполнение самостоятельной работы, результаты которой обсуждаются в аудитории в форме студенческих презентаций,
  • небольшие контрольные работы/проверки уровня знания,
  • самостоятельно выполняемая в течение семестра курсовая работа/домашнее задание

Конечно, студенту надо посещать все занятия, причем исключением может быть уважительная причина. К каждому занятию надо готовиться, прочитав уже изложенный материал и просмотрев новый материал, это лучше всего. Вместе с тем это -- минимальное академическое требование. Активная работа на занятиях, участие в разборе решения задач и примеров является важным показателем уровня ваших знаний по предмету, степенью активного владения методами. Компонентами изучения предмета являются (а) презентации в аудитории, (б) активное участие в занятии, (в) выполненная курсовая работа, а также (г) промежуточный зачет в середине семестра.

Образовательная философия: для всех нас интерес представляет "научиться тому, как учиться", а не просто освоение информации, которая кем-то излагается в упорядоченном виде.

Вверх

Коррекция 09.05.2007    

Спецглавы информатики: учебный курс, Спецглавы информатики: что читать, Спецглавы информатики: программа, Спецглавы информатики: студенты