[решено] Проверить, что строка начинается с русской буквы

resident · Сообщение **resident** » 17.07.2015 13:22:33

Здравствуйте!

Как узнать, что строка начинается с определенного диапазона русских букв?
Например, с букв от "А" до "Л" независимо от регистра.
Вот такой код не работает, пишет "Ordinal expression expected"

Код: Выделить всё

RussianLanguage := (str[1] in ['А'..'Л']) or (str[1] in ['а'..'л']);

Я конечно могу сделать функцию и в ней пробегать по массиву алфавита. Но надеюсь, решение есть из коробки. (С английскими же работает.)

alexs · Сообщение **alexs** » 17.07.2015 13:44:00

А вот так?

Код: Выделить всё

if UTF8Pos(UTF8Copy(S, 1, 1), 'АБВГабвг')>0 then
  ...
else
  ...

alex208210 · Сообщение **alex208210** » 17.07.2015 16:39:46

десятичное представление русских символов начинается с числа 208 144 и заканчивается числом 209 145. Если десятичное представление символа входит в диапозон между этими числами, то это символ кириллицы

resident · Сообщение **resident** » 17.07.2015 17:27:52

Спасибо, устраивающее меня решение найдено.

alexs писал(а):А вот так?

Отлично, но надо ж еще строку 'АБВГабвг' заполнять. Вручную?

alex208210 писал(а):десятичное представление русских символов начинается с числа 208 144 и заканчивается числом 209 145. Если десятичное представление символа входит в диапозон между этими числами, то это символ кириллицы

Да, стал делать во вашему принципу, благо кирилица оказалась упорядочена по алфавиту.
Но!
Откуда значения ваших чисел? Вы приводите два значения для каждого байта?
По статьям по другому:
http://mikhail.krivyy.com/2004/10/09/unicode-russian/
http://www.javaportal.ru/java/articles/ ... DK1_6.html

Для кириллицы в UNICODE отведен диапазон кодов от 0x0400 до 0x04FF

Я пока делаю так:

Код: Выделить всё

UTF8CharacterToUnicode(@str[1], CharLen)

Эта связка дает такие же значения как в статьях, т.е. от 0x0400 до 0x04FF (от 1024 до 1103).

alex208210 · Сообщение **alex208210** » 17.07.2015 18:16:54

я про utf8 говорил, у юникода свои значения

Отсюда

resident · Сообщение **resident** » 17.07.2015 19:06:12

alex208210 писал(а):я про utf8 говорил, у юникода свои значения

Ок
А как вы получаете числовое значение?
В модуле LazUTF8 что-то не найду такой подходящей функции.

alex208210 · Сообщение **alex208210** » 17.07.2015 23:48:48

ну например так:

Код: Выделить всё

showmessage(inttostr(ord(edit1.Text[1]))+inttostr(ord(edit1.Text[2])));

все гораздо проще))

Лекс Айрин · 18.07.2015 10:48:21

resident писал(а):А как вы получаете числовое значение?

это функция паскаля. Если это реализовано как в ТР, то проще всего так:

Код: Выделить всё

Var
    S:Char;
    A:byte absolute s;

resident · Сообщение **resident** » 18.07.2015 20:31:36

alex208210 писал(а):все гораздо проще))

Да, ваш попроще будет. Но вроде и мой вариант работает

Код: Выделить всё

{------------------------------------------------------------------------------}
function IsUtf8CharInLimits(const p, left, right: PChar): boolean;
  var
    CharLen: integer; // длина UTF в байтах, здесь не нужна, просто требуется в функции
    U: integer; // Юникод символа
  begin
    U := UTF8CharacterToUnicode(p, CharLen);
    if U = 0 then
      begin
        Result := false;
        exit;
      end;
    Result := (
      (U >= UTF8CharacterToUnicode(left, CharLen)) and
      (U <= UTF8CharacterToUnicode(right, CharLen)));
  end;

function IsUtf8CharRus(const p: PChar): boolean;
  begin
    // Кириллица упорядочена в таблице Unicode по алфавиту, при этом сначала
    //   идут заглавные буквы, а потом строчные, т.е. [А...Я, а..я]
    // Таким образом заглавная "А" и строчная "я" являются левой и правой
    //   границами диапазона
    Result := IsUtf8CharInLimits(p, 'А', 'я');
  end;

FreePascal.ru

[решено] Проверить, что строка начинается с русской буквы

[решено] Проверить, что строка начинается с русской буквы

Re: Как проверить, что строка начинается с русской буквы

Re: Как проверить, что строка начинается с русской буквы

Re: Как проверить, что строка начинается с русской буквы

Re: [решено] Проверить, что строка начинается с русской букв

Re: [решено] Проверить, что строка начинается с русской букв

Re: [решено] Проверить, что строка начинается с русской букв

Re: [решено] Проверить, что строка начинается с русской букв

Re: [решено] Проверить, что строка начинается с русской букв