Выбрать главу

К оглавлению

Технологии

Для интернета существует только 4% мировых языков. Остальные 96% мертвы

Олег Нечай

Опубликовано 08 декабря 2013

Для многих будет открытием, что жители Ближнего Востока предпочитают пользоваться для электронной переписки в интернете латинским алфавитом: сами слова они пишут по-арабски, но латинскими буквами. Более того, например, в Египте, многие вывески на магазинах тоже написаны по-арабски, но латиницей. Означает ли это, что древней арабской письменности пришёл конец?

Судя по новейшим исследованиям, арабскому языку и его традиционной письменности как раз ничего не угрожает — в отличие от нескольких тысяч других языков, которые просто не переживут цифровой век. Уже сегодня, по оценкам специалистов, целых 96% из более чем семи тысяч «живых» языков никак не используются в мобильных телефонах, планшетах и персональных компьютерах. Для Всемирной сети их уже не существует, так что интернет может стать для подавляющего большинства языков мира чем-то вроде глобальной катастрофы, которая стёрла с лица Земли всех динозавров.

Постепенные изменения, происходящие в тех или иных областях человеческой жизни, обычно описываются термином «эволюция», принятым в биологии. Однако когда учёные обсуждают эволюцию языков, терминология становится ещё более биологической: языки конкурируют за ареалы, порождают далёких родственников и умирают совсем как живые организмы. 

В рамках научной деятельности ЮНЕСКО ведётся целый Атлас языков мира, находящихся под угрозой исчезновения. На момент написания статьи к этой категории отнесён 2 471 язык, с разной степенью уязвимости, причём используемая там классификация чрезвычайно близка к классификации вымирающих биологических видов. Учёные оценивают степень опасности по различным критериям, в том числе по числу носителей языка, для которых он родной. В октябре 2013 года была опубликована любопытная научная работа «Цифровая смерть языков», в которой известный венгерский математик и лингвист Андраш Корнай исследует, какие из мировых языков находятся под угрозой вымирания в интернете и в электронных устройствах.

По мнению Корная, об опасности, грозящей языкам в реальной жизни, свидетельствуют три признака. Во-первых, это утрата функциональности, в то время как какие-то другие языки вытесняют его из обихода в целых областях — например, в повседневном электронном общении, в электронной коммерции или официальном бизнесе. «Если этого нет в интернете, этого не существует».

Во-вторых, это потеря престижа, особенно у молодого поколения. И, наконец, утрата языковой компетентности, которая выражается в появлении поколения «полуносителей», которые всё ещё понимают старшее поколение, но сами выработали для себя серьёзно упрощённую версию грамматики. 

Те же правила применимы и к интернету и цифровым устройствам, но если учёные давно привыкли наблюдать за упадком языков в реальном мире, то здесь возникает вопрос, возможно ли обратить процесс и сделать умирающие языки жизнеспособными в цифровом мире. Возможно ли полноценное онлайновое общение на таком языке и можно ли будет воспользоваться всем многообразием новых технологий с его помощью?

Задачей Корная было определить, как каждый из 7 776 мировых языков представлен в интернете. Во внимание принимались пять взаимосвязанных факторов: размер и демографический состав языкового сообщества, престиж языка, его идентификационная функция; уровень поддержки в программном обеспечении и представленность в Википедии.

Для этого он использовал различные методики. В частности, для определения степени представленности разных языков в общедоступных онлайновых текстах он измерял объём и число статей в Википедии на каждом из языков. Чтобы установить уровень поддержки языка в программном обеспечении, изучались как локализации интерфейса программ и системы проверки орфографии, так и просто его наличие в стандарте Unicode и других базах данных, позволяющих компьютерным устройствам автоматически опознавать разные языки.