может там иные "не удобные" символы?
да всяко разно пытался найти, не могу ничо понять. Нету ничего!!! У меня вот мысль, в С конец строки завершается ноликом. Я могу в fpc как то конечный ноль удалить (если предположить, что он там есть)? Строка if pos ('#0', vrem_str) > 0 then writeln ('tut nol'); ничего не находит.
vrem_str := utf8trim(vrem_str);//если она ютф8...
ваша строка также не работает. Иногда, пробел остается.
if (utf8pos(' ', vrem_str) = 0) and (length(utf8trim(vrem_str)) = 3) and (pos(chr(32), vrem_str) = 0) then begin
я получается не понятно написал. То есть я сперва тремя командами по любому поводу чищу строку на три символа от пробелов. Затем пытаюсь отверить условием, что в строке нет пробелов. Строка проходит по условию, типа пробелов нет! А на самом деле пробел есть!!!
Мне пришлось при создании таблицы указать check (my_str not like '% %'). И вот по этой проверке в БД идет отказ на запись данных, так как в записи есть пробел. Если что строки в текстовой файл я также выводил. Ага, есть там пробел, 32 код. Почему его trim не убирает - загадка.
---
serge#LVL ваши способы все попробовал, не помогают.
vada, вот так мне не легко, не знаю я кодировку.Поэтому я пытаюсь ее в ansi перегнать, чтобы быть уверенным, что кодировка мне известна теперь. А так, да, я верю людям и рассчитываю увидеть там utf8.
---
Не понял, что такое "неудобные символы"
FE..FF невозможны при кодировании вплоть до 31 бита У первого байта символа устанавливается столько старших битов, сколько байтов отводится под символ. Их конец обозначается терминальным битом 0, а оставшиеся биты соответствуют старшим битам значения. Байты 254 и 255 в двоичной системе: 111111102 и 111111112 соответствуют длинам 7 и 8, а длина 31 бит может быть закодирован шестью байтами.
https://ru.wikipedia.org/wiki/UTF-8Я короче сам ничо в этих кодировках не понимаю. Образно, ситуация такая. Естьв utf8 такие пары (тройки) байт которые не корректны при перекодировке. fpc (будь он неладен) обрабатывает их. А как куда такие кодировки выпускаем - так хоть разревись, например, постгрес их блокирует (будь он неладен дважды). В своих предыдущих постах с божьей помощью и вашими усилиями я наловчился конвертировать такие пары так, что на 100 тысяч строк только пара с ошибками остается. Все остальные пишутся в базу. Но вот при обратном чтении (внезапно) не всегда всё хорошо и возможно снова чо то не так со строками. Или я чего то не понимаю.
---
Как это кодировка не известна?
я копирую все главные и роботсы в интернете (чо мелочится). На сайтах часто врут про кодировку в тегах и ответах сервера; с сайтов очень часто распростроняют бинарные данные (как я понимаю ехе вирусы) напрямую со страницы; азиаты и исламисты живут в каком то другом мире с другими, отличными от европейских кодировками; сайты сами по себе имеют проблемы. Вкратце, я понятия не имею какая кодировка в строке, чтобы ускорить парсинг и обработку - я даже не думаю об этом.
+++
Главное, я не понимаю что делать. Как заставить работать trim?