Язык обработки данных AWK

       

Кириллические тексты


К сожалению, в России широко используются сразу несколько различных способов кодировки кириллических текстов. Перечислим наиболее популярные кодировки:

  • KOI8 - используется на терминалах больших машин и в UNIX-системах. Принята за стандарт при пересылке электронной почты в сети Relcom.

  • ISO - кодировка принятая в некоторых UNIX-системах.

  • Alt - альтернативная кодировка, используется на DOS-компьютерах.

  • Win - кодировка MS Windows, используется при русификации ОС Microsoft Windows. В качестве стандарта для машин CONVEX используется кодировка KOI8. Как нетрудно догадаться, тексты, сгенерированные в одной кодировке, не могут быть прочитаны на компьютерах, использующих другую. Отсюда возникает множество неудобств.

    Несколько смягчить остроту проблемы помогают программы перекодировки. Перечислим имеющиеся перекодировщики:

  • koi2alt, alt2koi - перекодирование из KOI8 в Alt и обратно

  • koi2win, win2koi - перекодирование из KOI8 в Win и обратно

  • koi2iso, iso2koi - перекодирование из KOI8 в Win и обратно

  • koi2strp - преобразование кириллического текста в KOI8 кодировке в фонетически соответствующий английский текст.



    Содержание раздела