Ещё одной областью, где нейросети имеют важное значение, является обработка
естественного языка.
Главное направление в обучении AI решению самых разных задач, связанных с пониманием
естественного языка – это использование так называемых больших языковых моделей.
Слова
естественного языка выступают как имена предметов мышления.
Естественный язык является наиболее эффективной и универсальной формой общения.
Модели способны понимать
естественные языки, включая их грамматику и стилистику.
Привет! Меня зовут Лампобот, я компьютерная программа, которая помогает делать
Карту слов. Я отлично
умею считать, но пока плохо понимаю, как устроен ваш мир. Помоги мне разобраться!
Спасибо! Я стал чуточку лучше понимать мир эмоций.
Вопрос: парафазия — это что-то нейтральное, положительное или отрицательное?
Важнейшая из знаковых систем – письмо, система записи знаков
естественного языка, устной речи.
Искусственные языки – это вспомогательные знаковые системы, создаваемые на основе
естественных языков для точной и экономичной передачи научной и другой информации.
Ещё более интересной является задача поиска соответствий между такими объектами в разных
естественных языках и соответствующих им языках тела.
Из более чем 7000 используемых в настоящее время в мире
естественных языков имеет письменность только малая часть – приблизительно треть.
Основными знаками формальной логики являются слова, а сложными – предложения
естественного языка.
Но, впрочем, я начну обзор с языка, создательница которого не пыталась явно исправлять недостатки
естественных языков – этот замысел ей лишь иногда приписывают потомки.
Любой из нескольких тысяч
естественных языков – это исторически сложившаяся знаковая система, образующая основу всей культурыговорящего на нём народа.
Отношение
естественного языка и поэзии определяется сложностью соотношения первичных и вторичных языков в едином сложном целом данной культуры.
ChatGPT обучается на огромном объёме текстовых данных и способен понимать и генерировать
естественный язык.
Более того, важнейшим элементом «языкового модуля» человека наряду с вычислительной системой является лексикон, несущий определённую семантическую информацию, так что базовые элементы
естественного языка нельзя считать пустыми.
Человек использует
естественный язык с двумя целями: не только передать информацию, но ещё и понять мир.
Техники обработки
естественного языка могут помочь историкам автоматически извлекать информацию, распознавать ключевые события и факты, а также распознавать и анализировать искажения или ошибки в текстах.
Итак, мы можем определить сущность поэтической структуры как наличие некоторых упорядоченностей, не подразумеваемых структурой
естественного языка, позволяющих отождествить в определённых отношениях внутритекстовые сегменты и рассматривать набор этих сегментов как одну или несколько парадигм.
Эти методы обработки
естественного языка позволяют автоматизировать анализ текстовых данных и извлечь полезную информацию для дальнейшего использования в различных областях, таких как бизнес-аналитика, исследования и мониторинг новостей.
Исследование неопределённости, с которой имеет дело любая когнитивная система, покрывает большое пространство – от сенсорной физиологии до когнитивной психологии (восприятие звуковой, зрительной и особенно тактильной и ольфакторной информации), изучение процессов обработки
естественного языка человеком и при автоматическом его анализе, проблемы эффективности систем «человек – компьютер» [Hollan et al., 2000].
Поскольку огромный, непрерывный окружающий мир в языке предстаёт как дискретный и построенный, имеющий чёткую структуру, соотнесённый с миром
естественный язык становится его моделью, проекцией действительности на плоскость языка.
Но анализ
естественного языка показывает, что значение словосочетания «находиться неподалёку» отнюдь не симметрично.
Это ещё одно принципиальное отличие
естественных языков животных – непроизвольность, тогда как язык человека функционирует под контролем сознания и воли.
Выражение мышления в
естественном языке можно считать первым шагом формализации.
Существуют концептуальные различия между «реальностями», описываемыми различными
естественными языками.
Например, программы машинного обучения скоро смогут, основываясь на обработке
естественного языка методом перебора, предсказать, какая из предложенных книг способна стать бестселлером.
Подходы к занимающей нас проблеме, которую можно сформулировать как роль
естественного языка в формировании языка изобразительного искусства, могут быть многообразными, как многообразны и темы, которые ждут своего обсуждения в рамках обозначенной проблематики.
Гиганты технологий, такие как Google и OpenAI, уже продемонстрировали глубокое обучение и машинное обучение с подкреплением на уровне или даже превосходящие человеческий уровень в конкретных задачах, таких как игра в шахматы или Go, а также понимание и генерация
естественного языка.
Многие научные отрасли (в том числе и педагогика) долгое время пользуются
естественным языком, лишь модифицируя его лексику.
Обработка
естественного языка даёт машинам возможность читать и понимать человеческий язык.
Описание – систематизация данных, полученных в результате наблюдения, измерения, эксперимента средствами
естественного языка, статистическими методами, графическими методами и др.
Мы для общения используем фрагменты языка тела нормалов – сокращённая версия
естественного языка.
Это не означает, что они воспроизводят все стороны
естественных языков.
С самого начала осознания каждым человеком многообразия явлений и себя в этой череде явлений, люди с помощью
естественного языка стали давать имена окружающим предметам, чтобы отличать одни предметы от других.
Лингвисты, работающие в области трансформационной грамматики, понимали, что исследовать системы
естественного языка, имея дело непосредственно с этим богатым и сложным комплексом выражений, – задача практически неосуществимая.
Учёные всех стран могут общаться между собой на языке формул и уравнений без особенных затруднений, языковых барьеров, неизбежных при использовании
естественного языка.
Таким образом, один и тот же текст может быть прочтён как некоторая образованная по правилам
естественного языка цепочка знаков, как последовательность знаков более крупных, чем членение текста на слова, вплоть до превращения текста в единый знак, и как организованная особым образом цепочка знаков более дробных, чем слово, вплоть до фонем.
Эта формализация, выражающая систему абстрактных элементов и их отношения, реализуется с помощью символизации, состоящей в том, что знаки и выражения
естественных языков с присущей им неопределённостью, громоздкостью и многозначностью (полисемией) заменяются системой знаков искусственного языка, имеющих точное значение и удобных для оперирования с ними.
В изложенном ранее естественная логика представлена как система построения и функционирования
естественного языка.
Вопросы на ограниченном
естественном языке могут использоваться не только во «внешнем» диалоге, но и быть операторами программ, решающих технологические задачи.
Разница между ними стала очевидной, как только возникла задача искусственного порождения (синтеза) и дешифровки (анализа) текста на каком-либо
естественном языке с помощью электронно-вычислительных устройств.
В
естественных языках существуют тысячи слов, описывающих свойства людей, а потенциальное разнообразие фраз, описывающих свойства, практически бесконечно.
Для более сложных данных (таких как изображения) обработки
естественного языка часто бывает недостаточно.
В каждом ареале конкретного
естественного языка практику использования логических форм выражения имён, выражения мнений об объектах познания, выражения мнений о таких мнениях, то есть рассуждений, и применения речевых форм общения, создают носители этого языка.
Что касается общеязыкового тезауруса, то его построить так и не удалось – смысловая структура
естественных языков оказалась слишком сложной.
Обрисованный выше антропоцентричный подход к значению языкового знака (равно как и к языку в целом) радикально отличается от подхода узколингвистического, чья узость – благополучно, правда, сочетающаяся с его весьма широким среди лингвистов распространением – заранее гарантирована их исходной трактовкой
естественного языка как чисто инструментального приложения к человеку, как некоторой дополнительной оснастки, необходимой ему для артикулированного общения с другими особями того же вида.
Конечно, было бы весьма соблазнительно попытаться построить наконец-то «общую теорию всего» как универсальную метатеорию на универсальном метаязыке, однако «“метаязыка не существует”» [188, с. 155] – не в смысле эмпирической констатации наличного положения дел («метаязыка нет, но он может/должен быть создан») и не в смысле отсутствия языковых средств для самоописания (даже обычные
естественные языки обладают такой способностью), но в смысле невозможности всёобъясняющего и самопрозрачного совершенного языка [см. 534], порождающего абсолютно прозрачные тексты, которые интерпретируют всё остальное, но исключают необходимость и возможность собственной интерпретации.
То, что я знал
естественный язык, имело ещё одно преимущество: произношение, синтаксис, модуляции голоса, идиомы – всё это я усвоил на слух.