Искусственный интеллект научился распознавать азиатские языки лучше человека: корейский, японский и китайский
Мы уже рассказывали, как искусственный интеллект научился распознавать арабский язык. В этот раз мы решили поставить более амбициозную задачу - объяснить, что для ИИ представляют собой азиатские языки.
Попробуй выучить
Японский в этом комиксе - это когда “колюще-режущие буквы смешаны с миленькими петельками”, китайский - “разные домики подвергаются атакам всяких летающих устройств”, а корейский просто “смеется над тобой”. Для человека, незнакомого с азиатской письменностью, эти языки действительно просто набор иероглифов, которые отличаются только вызывающими ассоциациями.
Мы хотим начать текст с сенсационного факта, который нам очень нравится: корейский язык состоит из букв, а не иероглифов! Хотя его письменность и кажется похожей на иероглифическую, на самом деле в наши дни она осталась только в двух странах в мире - в Японии и Китае. У корейцев есть алфавит под названием Хангыль, в котором 40 букв - 19 согласных и 21 гласная. Отличительной особенностью хангыля является то, что буквы объединяются в группы, примерно соответствующие слогам.
Как представителям науки, нам особенно импонирует, что письменность современной Кореи была разработана искусственно корейскими учеными в середине XV века по заказу четвертого царя династии Чосон Сечжона Великого.
Вспоминается знаменитая фраза Белинского про язык: “Создать язык невозможно, ибо его творит народ; филологи только открывают его законы и приводят в систему, а писатели только творят на нем сообразно с сими законами”.
Конечно, само существование современного корейского языка доказывает несостоятельность подобной позиции, хотя литературная элита Кореи тех времен с Виссарионом Григорьевичем, скорее, согласилась бы: в XV веке велись нешуточные публичные дебаты с протестами и бойкотами по поводу использования хангыля.
Зачем вообще нужно было создание корейского алфавита новой, так сказать, волны? Дело в том, что корейский язык в то время использовал исключительно китайские иероглифы. До начала XX века в литературе хангыль практически не использовался, так как считался слишком простым. Вместо него распространилась основанная на китайских иероглифах письменность ханча. Царь Седжон объяснял, что он создал новую письменность потому, что корейский язык отличается от китайского, и использованию китайских иероглифов очень трудно научиться. В то время грамоте обучались только мужчины-аристократы («янбаны»), а большинство простых корейцев было безграмотно.