Существует такая проблема:
Данные для программы могут быть приготовлены в любом текстовом редакторе и сохранены в текстовом файле.
Как можно при открытии файла определить какая кодировка была использована в нем?
Как распознать кодировку текстового файла
Модератор: Модераторы
-
SergeySmlInf
- новенький
- Сообщения: 40
- Зарегистрирован: 02.10.2007 07:59:26
- Откуда: Смоленск
Есть алгоритм основанный на частоте появленя определённых букв. Опледеление работает практически на 100%.
-
SergeySmlInf
- новенький
- Сообщения: 40
- Зарегистрирован: 02.10.2007 07:59:26
- Откуда: Смоленск
Спасибо!
Разбираюсь...
Разбираюсь...
-
SergeySmlInf
- новенький
- Сообщения: 40
- Зарегистрирован: 02.10.2007 07:59:26
- Откуда: Смоленск
Вообщем, помогло мало...
Решил задачу по другому:
Читаю текст, загружаю строку в TEdit
если в Edit1.text пусто считаю, что кодировка не UTF8
Решил задачу по другому:
Читаю текст, загружаю строку в TEdit
если в Edit1.text пусто считаю, что кодировка не UTF8
Как определяешь, что пусто?
Добавлено спустя 37 секунд:
А вдруг в тексте присутствует Латиница?
Добавлено спустя 37 секунд:
А вдруг в тексте присутствует Латиница?
-
SergeySmlInf
- новенький
- Сообщения: 40
- Зарегистрирован: 02.10.2007 07:59:26
- Откуда: Смоленск
А у меня первая строка файла данных содержит заголовок кириллицей.
А сравниваю тупо размеры: считаную строку с этой же строкой помещенной в Tmemo, TlistBox, TEdit
Пока глюков не было...
А сравниваю тупо размеры: считаную строку с этой же строкой помещенной в Tmemo, TlistBox, TEdit
Пока глюков не было...
Зачем такие сложности?
Код: Выделить всё
var
s: String;
...
if Utf8ToUnicode(nil,0,PChar(s),Length(s))<>-1 then
// UTF8
else
// Ansi
...
