Выбрать главу

Объединение latin1_swedish_ci это значение по умолчанию, которое, вероятно, используется большинством заказчиков MySQL. Хотя часто скажется, что это основано на правилах объединения Swedish/Finnish, имеются шведы и финны, кто не соглашаются с этой инструкцией.

Объединения основаны на latin1_german1_ci и latin1_german2_ci на стандартах DIN-1 и DIN-2, где DIN замещает Deutsches Institut f├╝r Normung (немецкий эквивалент ANSI, в общем). DIN-1 называется словарным объединением, а DIN-2 называется объединением телефонного справочника.

Правила latin1_german1_ci (словарного):

├Д = A

├Ц = O

├Ь = U

├Я = s

Правила latin1_german2_ci (телефонного справочника):

├Д = AE

├Ц = OE

├Ь = UE

├Я = ss

В объединении latin1_spanish_ci ├▒ (n-tilde) отдельный символ между letter between n и o.

Объединения macroman (Mac West European):

macroman_bin

macroman_general_ci (значение по умолчанию)

Объединения swe7 (7bit Swedish):

swe7_bin

swe7_swedish_ci (значение по умолчанию)

10.10.3. Центральноевропейские наборы символов

MySQL обеспечивает поддержку для наборов символов, используемых в Czech Republic, Slovakia, Hungary, Romania, Slovenia, Croatia и Poland.

Объединения cp1250 (Windows Central European):

cp1250_bin

cp1250_croatian_ci

cp1250_czech_cs

cp1250_general_ci (значение по умолчанию)

cp1250_polish_ci

Объединения cp852 (DOS Central European):

cp852_bin

cp852_general_ci (значение по умолчанию)

Объединения keybcs2 (DOS Kamenicky Czech-Slovak):

keybcs2_bin

keybcs2_general_ci (значение по умолчанию)

Объединения latin2 (ISO 8859-2 Central European):

latin2_bin

latin2_croatian_ci

latin2_czech_cs

latin2_general_ci (значение по умолчанию)

latin2_hungarian_ci

Объединения macce (Mac Central European):

macce_bin

macce_general_ci (значение по умолчанию)

10.10.4. Южноевропейские и ближневосточные наборы символов

Южныоевропейские и ближневосточные наборы символов, обеспечиваемые MySQL, включают Armenian, Arabic, Georgian, Greek, Hebrew и Turkish.

Объединения armscii8 (ARMSCII-8 Armenian):

armscii8_bin

armscii8_general_ci (значение по умолчанию)

Объединения cp1256 (Windows Arabic):

cp1256_bin

cp1256_general_ci (значение по умолчанию)

Объединения geostd8 (GEOSTD8 Georgian):

geostd8_bin

geostd8_general_ci (значение по умолчанию)

Объединения greek (ISO 8859-7 Greek):

greek_bin

greek_general_ci (значение по умолчанию)

Объединения hebrew (ISO 8859-8 Hebrew):

hebrew_bin

hebrew_general_ci (значение по умолчанию)

Объединения latin5 (ISO 8859-9 Turkish):

latin5_bin

latin5_turkish_ci (значение по умолчанию)

10.10.5. Балтийские наборы символов

Балтийские наборы символов охватывают Estonian, Latvian и Lithuanian.

Объединения cp1257 (Windows Baltic):

cp1257_bin

cp1257_general_ci (значение по умолчанию)

cp1257_lithuanian_ci

Объединения latin7 (ISO 8859-13 Baltic):

latin7_bin

latin7_estonian_cs

latin7_general_ci (значение по умолчанию)

latin7_general_cs

10.10.6. Наборы символов кириллицы

Наборы символов и объединения кириллицы для использования с Belarusian, Bulgarian, Russian и Ukrainian.

Объединения cp1251 (Windows Cyrillic):

cp1251_bin

cp1251_bulgarian_ci

cp1251_general_ci (значение по умолчанию)

cp1251_general_cs

cp1251_ukrainian_ci

Объединения cp866 (DOS Russian):

cp866_bin

cp866_general_ci (значение по умолчанию)

Объединения koi8r (KOI8-R Relcom Russian):

koi8r_bin

koi8r_general_ci (значение по умолчанию)

Объединения koi8u (KOI8-U Ukrainian):

koi8u_bin

koi8u_general_ci (значение по умолчанию)

10.10.7. Азиатские наборы символов

Азиатские наборы символов, которые поддерживает пакет, включают Chinese, Japanese, Korean и Thai. Они могут быть усложнены. Например, китайские наборы должны учесть тысячи различных символов.

Объединения big5 (Big5 Traditional Chinese):

big5_bin

big5_chinese_ci (значение по умолчанию)

Объединения cp932 (SJIS for Windows Japanese):

cp932_bin

cp932_japanese_ci (значение по умолчанию)

Объединения eucjpms (UJIS for Windows Japanese):

eucjpms_bin

eucjpms_japanese_ci (значение по умолчанию)

Объединения euckr (EUC-KR Korean):

euckr_bin

euckr_korean_ci (значение по умолчанию)