Страница 1 из 3
Решено: Как проверить орфографию и пунктуацию?
Добавлено: 22.06.2016 10:17:32
azsx
Хочу небольшую переменную (до 4 тысяч символов, несколько предложений) проверять на орфографию и пунктуацию (коменты юзеров). Делать максимально много автоисправлений, то есть автоматизировать проверку орфографии. Можно только в русском языке (можно и другие).
Не могу сообразить как это реализовать.
----------
Решено: способ на java для меня сейчас самый удобный, в коде только тестово его попробовал. Недостаток - большое потребление ресурсов при первом запуске.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 22.06.2016 11:59:29
mig-31
Hunspell, aspell
Re: Как проверить орфографию и пунктуацию?
Добавлено: 22.06.2016 15:18:20
azsx
фигасе какие запутанные проекты. может тогда проще
java -jar languagetool-commandline.jar -l ru Example.txt >aaa.txt
с программы
http://community.languagetool.org/rule/list?lang=ruплохо, что она сама не исправляет и надо вручную править, а также java, а также с двумя языками одновременно не работает. Но всё таки в разы проще.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 22.06.2016 18:29:31
pupsik
фигасе какие запутанные проекты. может тогда проще
это вы о чём?
Hunspell, aspell
там решается в пару строк. Плюс есть готовые классы (они и находят, и правят). На худой конец словарик либрешки можно "подвинтить".
п.с.
А что вы с жабки да в паскаль перекинулись? Или ошибся?

Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 00:39:16
azsx
там решается в пару строк
значит я не внимательно посмотрел. Я решил, что там как то совсем запутано взаимодействие и обязательно надо ру ловарь подгружать, родной типа совсем плох. Хорошо, мне надо посмотреть внимательнее.
А что вы с жабки да в паскаль перекинулись? Или ошибся?
программу на java которую я привел очень удобно что автоматом исправляет. Думал запускать как отдельный процесс, результат забирать с файла. В коде не делал.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 11:19:17
mig-31
Из паскаля вызывать ява программу -это уж слишком. Для Hunspell, aspell есть готовые биндинги.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 13:21:51
Лекс Айрин
Я думал кто-то предложит реальный компонент...
ЗЫ: Я бы аккуратнее пользовался автоисправлением.... очень уж много нервов эта возможность забирает в некоторых ситуациях. Например, мне приходится практически в каждом набранном в Libre/MS Office тексте приходится восстанавливать испорченный текст.
Добавлено спустя 30 минут 12 секунд:В принципе, задача сводится к подбору наиболее подходящего значения из списка (дерева) который, в принципе, будет занимать больше места чем сам алгоритм. Сложность в том, что нормальный обход подобного массива информации требует времени.
Добавлено спустя 1 час 18 минут 45 секунд:azsx, посмотри реализацию здесь
http://pasdoc.sourceforge.net/и описание
http://wiki.freepascal.org/Executing_Ex ... rograms/ru в самом конце страницы.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 16:10:36
pupsik
Я думал кто-то предложит реальный компонент.
а зачем?
https://github.com/cutec-chris/hunspell (не пробовал когда интересовался портировал дельфийское). А aspell - есть "офигительный" пример в фпс.
в Libre/MS Office тексте приходится восстанавливать испорченный текст
почему галочкой не пользуетесь: "автоматом не править" ?
п.с.
в принципе там и писать то нечего. Вот когда начинаешь писать, вот тогда и сложность. И подчёркивание не самая худшая проблема. Поэтому проще готовое "запустить".
Добавлено спустя 2 минуты 58 секунд:Из паскаля вызывать ява программу -это уж слишком.
не уверен что вызывать. Возможно текст "кидать" и ответ получать. Хотя.... хрен редьки не слаще. Для скриптов ещё и браузер тащить (вариант с запуском скрипта без браузера не рассматриваю - проще длл описанные выше).
Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 16:57:53
Лекс Айрин
pupsik писал(а):почему галочкой не пользуетесь: "автоматом не править" ?
Потому что она мне нужна (не все символы можно ввести с клавы, а копипастой не всегда реально вводить И уж темдолее, мало кто помнит все Alt коды таблицы символов). В моем блокноте эти символы стоят в заметках, поэтому автозамена не нужна в принципе. Вообще, надо будет добавить кнопочек с этими символами...
pupsik писал(а): И подчёркивание не самая худшая проблема.
А как этого добиться в мемо? На самом деле, не обязательно подчеркивать... можно указывать на слово другими методами...
Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 18:23:54
pupsik
Вообще, надо будет добавить кнопочек с этими символами...
в общем - лентяйничаем
А как этого добиться в мемо?
кросс - тяжко. Тем более в мемо. В общем - рисовать видимую часть.
Вроде как richmemo что то должен такое (не уверен). Ну..у и synedit - это ужас. Т.е. кириллица там, мягко говоря, проблемная.
Можно посмотреть в сторону
http://wiki.freepascal.org/ATSynEdit. Вроде как нормально должно получиться.
п.с.
Хотя, на данный момент, для меня это не актуальная тема. А когда была актуально - онли мемо был

Точнее импортировал делфи компонен (уже писал).
Re: Как проверить орфографию и пунктуацию?
Добавлено: 23.06.2016 19:16:56
Лекс Айрин
pupsik, моя дача... хочу деревья сажаю... хочу брусчатку кладу)))
pupsik писал(а):Тем более в мемо.
А мне портировать проект в рич/син едит это тихий ужас. Да и нет необходимости. Вообще, можно и подумать... когда (и если) буду список синонимов прикручивать.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 24.06.2016 01:44:34
azsx
нет лично мне надо только проверять 1 переменную на ошибки и исправлять их автоматом. Подчеркивать ничего не надо пока. Я временно написал обработкой внешней java программы (софт же для меня любимого). Я также думал есть нативный под паскаль компонент.
Скорее всего я поступил неверно.
Re: Как проверить орфографию и пунктуацию?
Добавлено: 24.06.2016 08:14:04
Лекс Айрин
azsx, глянь на сайтах типа исходники.ру
Re: Как проверить орфографию и пунктуацию?
Добавлено: 24.06.2016 08:22:58
pupsik
Хочу небольшую переменную (до 4 тысяч символов, несколько предложений)
вы явно что то путаете. Это не одна переменная, да же если вы всё это богатство в string загрузили.
Я временно написал обработкой внешней java программы (софт же для меня любимого).
т.е. вы уже сделали и оно работает, и вас устраивает?
Re: Как проверить орфографию и пунктуацию?
Добавлено: 24.06.2016 08:36:36
azsx
Это не одна переменная, да же если вы всё это богатство в string загрузили.
почему?
вы уже сделали и оно работает, и вас устраивает?
проверку сделал как функцию (жесть пишет файл, потом проверяет, потом читает второй файл). Но программа в целом не готова так как мне сложно в ней логически разобраться.