Курс "Cемиотика и обработка символьной информации" - Краткое содержание лекций - 2009 - 2010 уч. год

Семиотика и теория обращения с текстом (теория знаковых и речевых отношений) - Лекции 1 – 4.



Этот конспект дополняет полный курс, текст которого также есть на этом сайте. В Сорбонне есть правило, что лектор должен перед лекцией раздать студентам ее конспект – но читать он должен не так, как написано в конспекте! То есть ЭТОТ конспект не буквально повторяет текст курса, который есть на сайте – а отражает то, что было реально прочитано.

Интересная цитата

Логика развития информационной экономики в том, что она упрощает человеческую деятельность и повышает ее эффективность. «Информатизация» России нацелена на что угодно, только не на это … Рассмотрим наиболее очевидные и известные примеры … (см на сайте Коммерсанта)


Лекция 1 – 18-19 сентября 2009 г

и

Лекция 2 – 25-26 сентября 2009 г

и

Лекция 3 – 2-3 октября 2009 г

и

Лекция 4 – 9-10 октября 2009 г

ПОЗИЦИОНИРОВАНИЕ КУРСА.

Объединяющая идея курса. –

Перенесение бизнес процессов в Интернет - одна из актуальных научных и практических задач современности.

Обоснование и позиционирование курса.

Кудрявцев – надо учить тому что –

- трудно
- надо
плюс -
- сам бы не догадался этот курс изучать (ВР)

Состав курса – теор часть, Лабы и экзамен. Сайт курса.

Отзывы о курсе.

Покажем что курс соответствует ОБОИМ требованиям.

Система физтеховских курсов была адаптироана под - первый физтеховский аттрактор – «Атомный проект»

- Наше деление на факультеты этому соответствует – процессы в бомбе - ФОПФ, доставка ее – ФАКИ, управление ракетой (локация и обсчет ) – ФРТК и т д.
- Теорема существования этого аттрактора - феномен Тимофеева-Ресовского (Зубра) – из репрессированного биолога при появлении необходимости изучения влияния радиации на организм он стал респектабельным ученым.

Сейчас появился 2-й аттрактор – информатика.
Шутка – поступают будущие физики – заканчивают бывшие.

Основные курсы МФТИ соответствовали 1-му аттрактору.

Этот курс соответствует 2-му.

Здесь другой тип мышления, другие законы.

Пример: негативный – позитивный тип мышления, извлечение пользы из того и другого: – лень – работоспособность – зависимость от климата.

Примеры – Стоунхендж, прыжки с парашютом.

Другой тип законов – универсалии. Вовлеченность субъекта исследования в объект исследования – существенная деталь рассуждений.

Пример из состава курса – риторика как наука об эффективном знаковом произведении.

Это учить трудно самому но надо потому что сам этого не выучишь.

Обоснование курса.

Феномен третьего – знакового мира.
Интернет как мир знаков.
Существование и важность мира знаков. Григорий Сковорода (18-й век) и Карл Поппер (20-й век).

Почему третий мир? Первые два – мир материальный (реальность) и внутренний мир человека.

Концепция трех миров.

Науки изучающие первые два мира.
Физический мир изучают – физика, химия, …
Внутренний – мир психики – психология, лингвистика, …

Феномен ментальности.

Примеры взаимодействия миров

Проявление ментальности в реальном мире.

- очередь за билетами в метро на Тимирязевской

- срубание дубов на участке чтобы посадить картошку

- менталитет коллектива – 20 и 60-летие МФТИ.

Чтение мыслей – феномен Вольфа Мессинга.


Виртуальный, зеркальный и т п миры – миры ЗНАКОВ.
Надо знать законы мира знаков.
Наука изучающая мир знаков – семиотика.

Зачем изучать знаки ИТ специалистам?
Знаки в ИТ технологиях.
Это прежде всего – Интернет и вся связанная с ним деятельность.
А также информатика.
Рассмотрим типовой ИТ проект.

Где здесь присутствуют знаки?

Начало проекта – взаимодействие ИТ специалистов и заказчика – на словесном (знаковом!) уровне.

Определение предметной области – НАЗЫВАНИЕ объектов и процессов этой ПО - на словесном (знаковом!) уровне.

Работа с процессными схемами, отражающими БП реализующимися в данной ПО.

Построение формальной модели, интеграция словарей, метаданных, и т д - на словесном (знаковом!) уровне.

Вот зачем надо изучать знаки. Это все базовые процессы на знаковом уровне , отражающие типовую технологию процесса интеграции данного вида чел деятельности в ИТ систему.

Для этого есть и нужны и разрабатываются разные формализмы (знаки!) – нотации, протоколы, языки программирования – есть острая необходимость решать проблему Вавилонской башни.

Простой пример – тезаурус НАСА.

Важный пример – ПОСТ нотация – способ извлечения знаний из собеседника (заказчика)

Характерно – нет формул – но есть сложные и точные рассуждения (см выше).

Возрастает число, сложность и разнообразие знаковых систем (ЗС), все более сложной становится знаковая деятельность (ЗД). Но многие законы или универсалии, управляющие этим давно открыты и описаны, и прекрасно работают, то есть выполняются и прогнозируют ЗД. Мы начинаем их изучать.

СЕМИОТИКА.

Законы семиотики – Пирс, Моррис, Г. П. Мельников и его «Системология и семиотические основы кибернетики».

Определение знака. Знак – это то что заменяет любой объект - денотат. Д – любой объект из трех миров. Объект – это то с чем мы имеем дело.

Определение знака - 4-угольник Мельникова .

Знаковая система (ЗС) и знаковое произведение (ЗП).

ЗС – язык, матем. нотация, UML, ARIS, JAVA, опера, живопись, костюм, ...

ЗС и ЗП: – м быть много ЗС в ЗП – научная статья (язык, мат нотация, меры и т п).

Артисты – знаки. На сцене поют – за сценой говорят про зимнюю резину.

Богатство знаков – частотный словарь.

У Высоцкого – 6 тыс нетривиальных знаков (слов). У Мандельштама – 600-800. Но при этом их ЗП сравнимы по богатству содержания.

Виды знаков – икона, символ, индекс.

Икона – похожесть знака на денотат. Европейский и японский театр. Ономатопея. Феномен Кшесинской.


Акты именования – переименования. Имена – Морис – Морин. Родриго. Аттила. Убийца – киллер. Офис менеджер – завхоз.
Битлз - Леннон-Маккартни. Свердыщенко.
Немецкий – германский. Офис менеджер.

Части семиотики – синтактика, семантика и прагматика.

Мифы как сложные знаки – древние и современные.

Непобедимая и легендарная. Павлик Морозов и Зоя Космодемьянская.

Теория тезауруса.

Тезаурус – основная функция – движение от денотата к знаку – нахождение неизвестного знака для известного денотата.

Противопоставление толковому словарю – где движение обратное.

Организация классических национальных Т – Roget’s, Larousse, Duden.

Современные отраслевые Т – SNOMED, T NASA.

Парадигматика Т. Функции Т – интеграция деятельности, (другие? - можно как вопрос по выбору)


MULTITES – доступный софт для построения Т.



...

Продолжение - Люди и знаки. - Лекции 5 – 8.



Лекция 5 – 16 октября 2009 г


и

Лекция 6 – 23 октября 2009 г

и

Лекция 7 – 30 октября 2009 г

и

Лекция 8 – 5 ноября 2009 г


ЗНАКОВАЯ ДЕЯТЕЛЬНОСТЬ.

Люди и знаки. – Знаковая деятельность (ЗД) людей.

Поиск универсалий.

Теперь мы займемся поиском закономерностей в том как люди пользуются знаками, создают свои знаковые произведения (далее - тексты) – то есть материализуют знаки.

Это значит – будет изучаться знаковая деятельность людей. А это значит что прежде всего мы должны изучать речевую деятельность – то как люди используют самую сложную и универсальную знаковую систему – язык.

Для чего мы это делаем? – Это относится и ко всему курсу.

Мы делаем две вещи –

1. Находим универсалии того или иного вида знаковой деятельности и
2. Обобщаем их.

Зачем? – Для продвинутых – если не интересуют общие законы – то достаточно актуально знать законы развития Интернета. Даже небольшое прогностическое знание дает уже большое преимущество.

Процесс нахождения мы уже демонстрировали – см. изложение выше. И будем это делать сейчас.

А процедуры обобщения (пусть неполный список) – мы возьмем из парадигм ООП (Объектно-ориентированного программирования).
Эти парадигмы – абстрагирование, наследование, полиморфизм и инкапсуляция.

Например – обнаруженные и описанные законы (регламент) обращения с жанром молва, то есть абстрагированные нами в изложении ниже, путем простого наследования могут объяснить распространение в Сети любого слуха, текста, видео. Свежий пример – быстрое распространение фильма Zeitgeist осенью 2008 г.

То есть - для работы с этим материалом нам будет удобно (часто в фоновом режиме) пользоваться парадигмами ООП – абстрагированием, наследованием, полиморфизмом, инкапсуляцией над объектами и классами. При желании можно это расписать в явном виде выбрав это как вопрос по выбору.

Начнем с простейшего – дописьменная речь. Как найти эти универсалии и развить их затем через парадигмы ООП в этом случае?

Люди САМИ должны отразить их в своих паремиях (пословицах и поговорках). Как показало исследование Ю. В. Рождественского (см. текст лекций), эти универсалии делятся на пять групп –

1. Слово (то есть текст, знак) – дело (денотат, деятельность). – Связь ЗД и практической деятельности.
2. Свойства слова (то есть знаков).
3. Организация речевых отношений (ЗД!).
4. Правила для говорящего (создающего знаки).
5. Правила для слушающего (воспринимающего знаки).


Далее нас будет интересовать больше всего Организация речевых отношений. Можно много и интересно говорить о других группах – но на это нет времени. Можно опять же – взять это как вопрос по выбору – квалифицированно поискать в Сети, обобщить, пользуясь уже имеющимися знаниями.

Но можно хотя бы кратко сказать про группу универсалий из п. 1. – цитатой – Абдуллы аль-Бадри, ОПЕК – Мы покупали и продавали нефть, которой не было. – Ведомости. – 22-Х-08. – И не только нефть. Массовое нарушение этой группы универсалий привело к кризису 2008 г.


Но сначала займемся тем, как материализуется знак (текст).

То есть -

1. Чем материализуем (инструмент).
2. На чем.

Понятие фактуры

1. Инструмент речи.
2. Материал речи (на что наносится знак, текст)

Начнем с простого.

Устная фактура. Ее особенности.
Письменная фактура. Ее особенности.
Печатная фактура. Ее особенности.

Треугольник Рождественского.

…. – см текст лекций


Особенности перехода от одной фактуры к другой.

Это очень опасно. Правила еще не установились и не освоены. Первыми удар встречают страны, первыми осваивающие новую фактуру. -

Переход -
F2 – F3 – Германия (Крестьянская война после массового появления печатной Библии), как следствие - Испания (запрет на ввоз Библии из Германии под страхом смертной казни)

F3 – F4 – CША. (9-11, кризис 2008 г)

Фактура речи на машинном носителе. Ее особенности. Интернет.

Вернемся к исходной идее.

Есть ли правила в самой интересной для нас сейчас области - Организация речевых отношений?

Есть.

Их снова пять групп.

1. Авторство-создание Текстов (то есть знаков).
2. Хранение Т.
3. Передача Т.
4. Копирование.
5. Цитирование.

Уникальное сочетание этих пяти групп правил для каждого жанра ЗД есть РЕГЛАМЕНТ. Его нарушение также ведет к тяжким последствиям (см выше). И то, что это бывает не всегда и не сразу – только хуже.

Проследим это на примере трех жанров дописьменной речи – диалог, молва, фольклор.

…. – см текст лекций


Продолжение - Автоматическая декомпозиция и анализ знаков. Парсинг. Декларативное программирование. Пролог и теория формальных грамматик. - Лекции 9 - ...



Лекция 9 – 12 ноября 2009 г и начало Лекции 10 – 19 ноября 2009 г

Автоматическая декомпозиция и анализ знаков. Парсинг.

Декларативное программирование.

Пролог и теория формальных грамматик


Анализ (декомпозиция) знакового произведения. Парсинг.

Работы по ИИ.

Теория формальных грамматик. Наум Хомский. Syntactic Structures – 1956.

Синтактика и семантика в Формальной Грамматике. Феномен green ideas - виртуальный мир, где они возможны. Зеленые идеи борются - Филфак, книга Будагова.


Шествие идей Хомского. Создание птичьих терминологических языков - чтобы не понимали непосвященные в школу грамм. формализма. Форма Бэкуса-Наура (БНФ - BNF)для описания формальных языков.

Более подробно о Хомском и формальных грамматиках можно найти в Сети, сделав запрос "Хомский БНФ" - или из др кл слов из этого изложения.


Декларативные языки программирования


Пролог.

Эволюция языков программирования. Никлаус Вирт и Непейвода.

Языки обработки символьной информации.

Лисп. Пролог. РЕФАЛ – Анатолий Турчин.

Их особенности.

Процедурные (как?) и декларативные (что?) языки программирования

Декларативные языки программирования
– мыслить в терминах ЦЕЛЕЙ – что нужно?.

Сама сущность Пролога – указывать не КАК сделать – а ЧТО сделать.

Понятие предиката.

Предикация - это любое суждение

О чем угодно - это есть минимальное предложение

Например – что ты мужчина – сразу на Прологе man(Сергей) – одноместный

Ты – сын Ивана двуместный dad (Иван, Сергей)

Может быть многоместный



Простейшая процедура работы с Прологом

Пролог – программа –

Закодированный предикат – «отец»



Dad (tom,pete)



Запрос –

Dad (X,pete)


Ответ –

X = pete



Сложные конструкции –

DED (X,Y) :- DAD (X,Z), DAD (Z,Y).



Особенности лаб работ.

Программы SENAN и GEOBASE.



Рефлексия - общее понятие о том, что это такое.

Р о том, что мы изучили - покрываем декларациями (предикатами об объектах) ПО - и задаем об этом ПО вопросы - ЧТО нам нужно.

Прологовский когнитивный процессор работает с предикатами и выдает ответ.

Но - обратим внимание - предикат DED - это уже предикат на двух предикатах DAD n t - это суждение - отец отца

А может быть еще интереснее - рекурсивное определение - неизвестное определяем через само неизвестное!

PREDOK (X,Y) :- PREDOK (X,Z), DAD(Z,Y).

Послав запрос -

PREDOK (X,tom)

мы получим всех предков Тома - если все они будут достаточно подробно описаны.

Это все очень мощные и эффективные свойства Пролога

...


Продолжение

E-mail: rykov2000@mail.ru



Сайт управляется системой uCoz