1 / 34

Интеллектуализация процессов обработки потоков данных

Интеллектуализация процессов обработки потоков данных. БГУ РФиЭ Кафедра Интеллектуальных Систем Адуцкевич Иван Анатольевич. Введение.

nellie
Download Presentation

Интеллектуализация процессов обработки потоков данных

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Интеллектуализация процессов обработки потоков данных БГУ РФиЭ Кафедра Интеллектуальных Систем Адуцкевич Иван Анатольевич

  2. Введение • На современном этапе развития научно-технического деятельности характерно нарастание неформализуемых или плохо формализуемых проблем, алгоритмического решения которых не существует или не может быть реализовано на базе существующих программно-аппаратных средств. • При попытках реализации некоторых проблем часто приходится сталкиваться с необходимостью взаимодействия с пользователями, не являющимися профессиональными программистами или математиками. • Приходится также организовывать их взаимодействие с самого различного рода системами на понятном им языке. Следовательно, нужно знать самые общие закономерности обработки нечисловой информации и организации знаний.

  3. Цели курса • Осветить самые общие закономерности обработки нечисловой информации и организации знаний. Исходя из этих соображений построен состав учебного материала и цели курсов – «Интеллектуализация процессов обработки потоков данных» и «Интеллектуальные системы обработки потоков данных». Они определяются двумя описанными выше факторами: • наличием пользователей, не являющимися профессионалами в информатике, • необходимостью решать плохо формализуемые проблемы, корректно выражая их решение в виде различного рода знаковых когнитивных структур.

  4. Состав курса • В состав курса входят достаточно сложные понятия из разных наук, которые надо освоить для построения эффективных информационных систем. • Материалы лекций содержат живые примеры для облегчения понимания теоретической части курса. • Лабораторные работы по проектированию онтологий – простейших структур описывающих знания и бизнес моделированию. • Предполагается подготовка рефератов по практической части курса.

  5. Знаки и знаковыесистемы. Семиотика – наука о знаках.

  6. Знаки и знаковые системы • Определение знака. Если мы видим объект S, то у нас в сознании возникает его зрительный образ S1. Если мы видим другой объект D, то возникает образ этого объекта D1. S1 ---> D1 • Знак (S) - это то, что замещает в нашем сознании другой объект (D). • В этом случае мы говорим, что S - это знак, а D - это его денотат.

  7. Синтактика, семантика и прагматика. • Основатель современной науки о знаках - семиотики Чарльз Пирс считал, что она делится на три части - синтактика (правила, как корректно складывать знаки), семантика (как знаки и знаковые структуры связываются со своими денотатами). А также прагматика - наука об отношении (например, использовании) создателей и получателей знаков к своим знаковым произведениям. • Пример. Есливыслышитеслово "Пожар", томожетепройтимимоилиброситьсяпожартушить. Приодинаковойсемантике (человекпонялслово «Пожар») можетреализоватьсяразноепрагматическоеотношениеполучателя к полученному и понятомуимзнаковомусообщению.

  8. Знаки и культура • Семиотика - интересная наука. • Например, костюм - самообозначение человека. Костюм – это то, как он хочет, чтобы его воспринимали. Джинсовый костюм и пиджак с галстуком - разные знаки. Человек в соответствующем костюме явно или неосознанно обозначает им себя и задает прагматическую реакцию на себя окружающих. • В культуре существует огромное количество знаковых систем – приметы, знамения, живопись, музыка, танец и многое другое. Пренебрежение незначимостью какой-либо из них плохо только для того, кто это делает.

  9. Синтагма и парадигма • Синтагма - это знаковая структура, образованная по правилам синтактики • Парадигма - на основании каких правил отобран знак для каждой знаковой позиции в этой структуре. • Например: синтагма - этоединствотого, чтосейчасначеловекеодето - какиетуфли, брюки, пиджак, рубашка. Можносказать, чтопарадигманаходится в гардеробе, т.е.изкакогонаборарубашек, пиджаков и т.д. и наосновекакихсоображенийбылаобразованаданнаясинтагма (одетыйначеловекакостюм).

  10. Типысвязеймеждузнаком и денотатом • Однозначнаясвязь «один к одному». • Одинзнаксвязан с двумя и болееденотатами (D1<--S-->D2) –этополисемияилимногозначностьзнака. • Два и болеезнакассылаютсянаодинденотат - этосинонимия (S1-->D<--S2). • Омонимия - это когда знаки означают совсем разное, но случайно совпадают по начертанию или звучанию.

  11. Знак – егозначение и смысл • Значениезнакаестьнаборденотатов, которыйможетбытьреализован в тойилиинойкоммуникации. • Смысл – этоживая и конкретнаяреализациязнака (егозначенияилиденотата) в живой и реальнойкоммуникации. • Никакихслов и словарейнехватитдляперечислениявсехвозможныхденотатов, встречающихся в реальнойкоммуникативнойпрактике. Иногдасмыслысловпонимаютсянеправильнотеми, к комуониобращены.

  12. Знаковое пространство. Парадигма трех миров • Существуюттрифундаметальныхклассаобъектов – материальные, идеальные (ментальные) и знаковые. • В информационной практике приходится оперировать с объектами материального мира или реальной действительности, окружающей нас, и идеальными объектами – продуктами нашего мышления, существующими только в нашем сознании. Удобно обозначить первое множество объектов буквой R (от английского слова reality), а второе множество буквой М (от английского слова mind). Однако, будучи объектами материального мира, знаки имеют свою специфическую природу. Они замещают в нашем сознании другие объекты, реальные и воображаемые. Поэтому часто бывает удобно оперировать со знаками как с отдельным множеством. Назовем это множество S (от латинского слова signum – знак).

  13. Знаковые системы и типы знаков. • Язык - самаяразвитаязнаковаясистема (ЗС). Однакоэтонезначит, чтоеюможнозаменитьдругие ЗС. • Различают знаки трех типов. Знаки типа иконы (похожие на денотат), символы (непохожие на денотат) и индексы-признаки (часть денотата становится его знаком).

  14. Понятиеконнотата • Коннотаты- вторичныеилисопутствующиезначения (лицо, физиономия, морда, рожа – общий денотат). • Коннотатымогутбытькакобщезначимыми, так и индивидуальнымиилиобщимитолькодлякаких-тоопределенныхсоциальныхгрупп. • S ---> D + K1 + K2 + ... где К1, К2 и т.д. естьконнотаты. • Вторичнымизнаковымиассоциациями (коннотатами) пользуютсяприсозданииразличныхзнаковыхконструкций, умелоиспользуявозникающие у ихполучателейассоциации-коннотаты.

  15. Проблема похожести знака на денотат - ономатопея • Насколькознактипаиконаможетбытьпохожнасвойденотат?Например, присозданииоченьважныхдлялюдейдорожныхзнаковэтообстоятельствоихсоздателистаралисьучесть. Знак «извилистаядорога», «пешеходы» и многиедругиепохожинасвоиденотаты, насколькоэтовозможно. • Например. Зрителиищут и находят (возможно, невсегда) чертысходствамеждуперсонажами и исполнителями. Нетолькововнешнихчертах, ночасто и в судьбе. Присутствиепохожести, тоестьявлениеономатопеирезкоувеличиваетстепеньвоздействияигрыартистаназрителя.

  16. Случайность и закономерность в знаках и знаковых системах • Узуальность – общепринятое повсеместное использование знака • Окказиональность – случайное, одноразовое употребление знака. • Необходимо учитывать и число людей использующих знак, т.е. членов речевого коллектива. • Удобно представить данные свойтсва в виде графика, где ось X – окказиональность и узуальность, а ось Y – число членов речевого коллектива. • (1,1) – узелок на платке(акт коммуникации с самим собой, чтобы не забыть) • (1,2) – два человека условилось сообщить одним знаком о каком-либо событии • (много, много) – современные профессиональные языки

  17. Прагматика – частьсемиотики • К прагматике относится две группы проблем – то, как относится к своему знаковому произведению его создатель, и то, как к полученному знаковому произведению относится его получатель. • Например, очень часто важно не только создать корректный текст с точки зрения синтактики и семантики. Важно также и то, какой эффект этот текст произведет на получателя. Создатели многих песен отмечают, что хорошие (с их точки зрения) песни, на которые ушло много труда, не стали популярными. И наоборот.

  18. Словари, слова и понятия.

  19. Словари и слова • Язык – самаяразвитая и совершеннаязнаковаясистема. • Заключает в себе две функции: • Коммуникативная • Кумулятивная • Первые научные сообщества занимались прежде всего составлением словарей национальных языков. Составителей словарей чтут и помнят, например, Владимир Даль в России или Братья Гримм в Германии. • Несколько примеров типов словарей: • Толковый словарь • Словари омонимов, синонимов • Разрешение омонимии – огромная проблема современной информатики.

  20. Актыименования. Семиотические универсалии. • Словари учат как правильно управляться с уже готовыми словами, не путаться в их значениях, правильно их употреблять. • Слова образовались в результате массовых актов именования. Однако, имя своему ребенку можно придумать самому. • Длятого, чтобыуспешнореализовыватьсемиотическуюдеятельность, надознатьеезаконы. Этизаконы в семиотикеудобнееназыватьуниверсалиями. Универсалии, в отличиеотзаконовфизикиилиматематики, необладаютобязательнымдействием. • Например, реноминация–периодическиеволныстилевыхпереименований. Теперьвсечащевелосипедыназываютбайками, песни из фильмов – саундтреками. • В английском нет слов «полтора» или «сутки», а у выражения «круглый квадрат» вообще нет денотата.

  21. Треугольник Фреге. Связь между знаком, денотатом и понятием. • Треугольникзнак-денотат-понятие (концепт) называетсятреугольникомФреге. • ЧастоТФ можетслужитьхорошеймодельюдлямногихсемиотических и философскихрассуждений. ТФ легковписывается в парадигмутрехмиров. • Припомощи ТФ можнопостроитьпонятную и эффектнуюмоделькоммуникации • еслимызадумаличто-тосказать, (скажем, простолнашемусобеседнику), томыначинаем с мысли о столе, затемконкретизируемее в денотатетем, чтопорождаемзнак. • нашсобеседникполучаетзнак, отождествляетего с денотатом, а затемпонимаетнашумысль.

  22. Теория тезауруса

  23. Тезаурус – просхождение • Двуязычныесловариустанавливаютотношениязнак-знак в разныхязыка • Толковыесловариописываютотношениезнак-денотат. • Тезауруспо-латински и естьбогатство. • От классификации (посути - отденотата) намтребуетсянайтинужныйзнак. Мы можем, двигаясьпопонятнойнамклассификации, найтилюбоенужноенамслово (хотябылатинскогоязыка), незнаяего.

  24. Тезаурус - определение • словарь, в котором максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах; • идеографическийсловарь, в которомпоказанысемантическиеотношения (родо-видовые, синонимические и др.) междулексическимиединицами, тоестьотношениямеждуденотатами, которыеониобозначают. • обеспечивающий поиск от смыслов к лексическим единицам, т.е. поиск слов, исходя из понятия.

  25. Теория тезауруса и семиотика • в толковомсловаремыдвижемсяотзнака к денотатуS ---> D • денотат у нас есть функция от знака: D = f(S) • В тезаурусе же реализуется обратная функция - D---> S • знак есть функция денотата: S= F(D) • Для создания тезауруса необходимо предоставить пользователю структурированную картину мира: • Илюстрации популярных видов человеческой деятельности • Иерархическое структурирование. От общего к частному. От изначальныхпонятиймир-человек, живая-неживаяприрода, миртехники и т.д. читательспускается к нужномуемуденотату, послечегонаходитегоназвание

  26. Теория тезауруса и информатика • Во-первых – этоинформационныйпоиск (ИП). • Во-вторых – это интеграциязнаний и повышениеэффективноститрудовойдеятельностизасчетоптимизациипроцессакоммуникации.

  27. Тезаурус - парадигматика • длялюбойсловарнойстатьитезаурусанужноуказать в какиеболееобщиепонятия, конструкции и т.п. интегрируетсяописываемыйеюобъект (денотат) - т.е. гдевышестоящаяобобщающаястатья. • Эта стройная иерархическая классификация дополняется перекрестными связями самого разного рода - чаще всего синонимическими или антонимическими, различного рода ассоциативными связями. Так реализуются тезаурусные функции, описывающие семантические связи между денотатами.

  28. Тезауруснаятерминология • вышестоящийтерминпоотношению к текущейсловарнойстатьеназываетсягиперонимом (hyperonym). • Дляденотата «дерево» гиперонимомбудет «растение». • нижележащийтермин - соответственно - гипоним (hyponym) • Длянашегопримера с деревомэтобудутденотаты «ель», «береза»

  29. Популярныетезаурусы и ихособенности • Немецкий тезаурус DUDEN • Накаждойегостраниценарисованкакой-либовидчеловеческойдеятельности в картинках. • Например, железнаядорога. Откаждойкартинки, изображающей ж-д пути, вокзалы, вагоны и т.п. отходятстрелочки с номерами. Насоседнейстраницеоколокаждогономерапрописаноегоназваниенанемецком, русском, английскомязыке. • Дляоптимизациипроцессоводнозначного понимания терминовв областиаэрокосмическихисследованийбылсоздантезаурус НАСА. • Вмедицинеэтотезаурус SNOMED

  30. Эволюциязнаковыхсистем. Законысуществованиятекстов в обществе.

  31. Парадигматика или правила обращения с текстами. • Существует пять групп правил: • отношения«слова» и «дела», тоестьмысли, речи и действия, уместно здесь вспомнить треугольник Фреге • правиладляговорящего • правилаобращения с текстомдляслушающего (правилречевогоэтикета) • правила о свойствах слова, как знакового произведения • организация речевых отношений, то есть правил ведения речи и устройства диалога

  32. Парадигматика или правила обращения с текстами. • Соотношение слова и дела, то есть слова как знака и денотата как деятельности человека также подробно описывается паремиями всех народов. Единодушно осуждаются люди, не реализующие сказанное ими в деле. Конечно, реализация этой группы правил зависит от конкретных обстоятельств и культурных традиций. Например, в американской деловой жизни устное слово бизнесмена оценивается практически наравне с письменным. Для подтверждения этого факта существуют особые речевые штампы (знаки, сигнализирующие о факте делового обещания). Незнание этой традиции может привести к досадным ошибкам. • Говорящему предписывается ни в коем случае не строить свою речь с таким содержанием, которое может нанести ущерб слушающему (слушающим). • Обращенная к слушающему речь должна быть выслушана и осмыслена как действие, наивысшее по приоритету. Если слушающий был занят другими делами, он должен их прервать и выслушать обращенную к нему речь, никакими действиями не мешая ее передаче. Всякое нарушение этого правила трактуется как крайняя невоспитанность или сознательная грубость, если слушающего не побудили к этому крайние обстоятельства. • Свойства слова. Приведем для примера только одну немецкую пословицу, довольно четко формулирующую эту группу универсалий. “SharfeSchwerteschneidensehr – scharfeZunge – nochvielmehr.” – «Острые мечи ранят больно – острые языки – еще больнее». • И, наконец, пятая группа касается правил устройства речи – то есть правил, которые регулируют процессы речевой коммуникации. Эти правила наиболее важны и интересны для специалистов по ИТ (информационным технологиям). Далее эти правила будут подробно изложены отдельно.

  33. Материализация знака. Фактура речи. • Фактура речи(ФР) –этоорудияречиплюсматериалписьма • устнаяречь (УР), • письменнаяречь, • печатнаяречь, • речьмассовойкоммуникации и Интернета(F4) • Сейчаспроисходитпереход к новойфактуреречи.

  34. Переход от одной фактуры речи к другой • По мере развития технических средств для записи текстов на материальные носители происходит переход от одной фактуры речи к другой. • Каждая новая фактура речи не уничтожает другие, более ранние, а дополняет ее и сосуществует вместе с ними. • Каждая новая фактура речи модифицирует предыдущие, более ранние фактуры речи. • При переходе на новую фактуру речи происходит модификация и перестройка правил обращения с речью в этой новой фактуре. • Как правило, при этом не создаются новые универсалии, они просто адаптируются к новым условиям существования текстов в обществе (новой фактуре). • Переход на новую фактуру речи и адаптация старых универсалий к новым реалиям происходит одновременно и зачастую стихийно. • Новые правила фиксируются юридически или в формах традиций и обычаев, в обоих случаях с запозданием. • Отсутствие явных правил обращения с речью в новой, уже массово использующейся фактуре речи может вызвать в обществе конфликтные ситуации, иногда в массовом масштабе. • Образование новых жанров и родов словесности в новых фактурах речи, а также правил обращения с этими текстами можно уподобить тому, что происходит в рамках парадигмы наследования ООП (объектно-ориентированного программирования) - ничего не теряется и не уничтожается, а только дробится, развивается из старого с включением новых "констант" и "методов".

More Related