Решено: Как проверить орфографию и пунктуацию?

Общие вопросы программирования, алгоритмы и т.п.

Модератор: Модераторы

Решено: Как проверить орфографию и пунктуацию?

Сообщение azsx » 22.06.2016 11:17:32

Хочу небольшую переменную (до 4 тысяч символов, несколько предложений) проверять на орфографию и пунктуацию (коменты юзеров). Делать максимально много автоисправлений, то есть автоматизировать проверку орфографии. Можно только в русском языке (можно и другие).
Не могу сообразить как это реализовать.
----------
Решено: способ на java для меня сейчас самый удобный, в коде только тестово его попробовал. Недостаток - большое потребление ресурсов при первом запуске.
Последний раз редактировалось azsx 02.07.2016 11:59:31, всего редактировалось 1 раз.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как проверить орфографию и пунктуацию?

Сообщение mig-31 » 22.06.2016 12:59:29

Hunspell, aspell
mig-31
постоялец
 
Сообщения: 224
Зарегистрирован: 14.07.2011 13:46:48

Re: Как проверить орфографию и пунктуацию?

Сообщение azsx » 22.06.2016 16:18:20

фигасе какие запутанные проекты. может тогда проще
java -jar languagetool-commandline.jar -l ru Example.txt >aaa.txt
с программы http://community.languagetool.org/rule/list?lang=ru
плохо, что она сама не исправляет и надо вручную править, а также java, а также с двумя языками одновременно не работает. Но всё таки в разы проще.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как проверить орфографию и пунктуацию?

Сообщение pupsik » 22.06.2016 19:29:31

фигасе какие запутанные проекты. может тогда проще
это вы о чём?
Hunspell, aspell
там решается в пару строк. Плюс есть готовые классы (они и находят, и правят). На худой конец словарик либрешки можно "подвинтить".

п.с.
А что вы с жабки да в паскаль перекинулись? Или ошибся? :)
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как проверить орфографию и пунктуацию?

Сообщение azsx » 23.06.2016 01:39:16

там решается в пару строк

значит я не внимательно посмотрел. Я решил, что там как то совсем запутано взаимодействие и обязательно надо ру ловарь подгружать, родной типа совсем плох. Хорошо, мне надо посмотреть внимательнее.
А что вы с жабки да в паскаль перекинулись? Или ошибся?

программу на java которую я привел очень удобно что автоматом исправляет. Думал запускать как отдельный процесс, результат забирать с файла. В коде не делал.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как проверить орфографию и пунктуацию?

Сообщение mig-31 » 23.06.2016 12:19:17

Из паскаля вызывать ява программу -это уж слишком. Для Hunspell, aspell есть готовые биндинги.
mig-31
постоялец
 
Сообщения: 224
Зарегистрирован: 14.07.2011 13:46:48

Re: Как проверить орфографию и пунктуацию?

Сообщение Лекс Айрин » 23.06.2016 12:32:54

Я думал кто-то предложит реальный компонент...

ЗЫ: Я бы аккуратнее пользовался автоисправлением.... очень уж много нервов эта возможность забирает в некоторых ситуациях. Например, мне приходится практически в каждом набранном в Libre/MS Office тексте приходится восстанавливать испорченный текст.

Добавлено спустя 30 минут 12 секунд:
В принципе, задача сводится к подбору наиболее подходящего значения из списка (дерева) который, в принципе, будет занимать больше места чем сам алгоритм. Сложность в том, что нормальный обход подобного массива информации требует времени.

Добавлено спустя 1 час 18 минут 45 секунд:
azsx, посмотри реализацию здесь http://pasdoc.sourceforge.net/

и описание http://wiki.freepascal.org/Executing_Ex ... rograms/ru в самом конце страницы.
Аватара пользователя
Лекс Айрин
долгожитель
 
Сообщения: 5723
Зарегистрирован: 19.02.2013 16:54:51
Откуда: Волгоград

Re: Как проверить орфографию и пунктуацию?

Сообщение pupsik » 23.06.2016 17:07:38

Я думал кто-то предложит реальный компонент.
а зачем? :mrgreen:
https://github.com/cutec-chris/hunspell (не пробовал когда интересовался портировал дельфийское). А aspell - есть "офигительный" пример в фпс.

в Libre/MS Office тексте приходится восстанавливать испорченный текст
почему галочкой не пользуетесь: "автоматом не править" ?

п.с.
в принципе там и писать то нечего. Вот когда начинаешь писать, вот тогда и сложность. И подчёркивание не самая худшая проблема. Поэтому проще готовое "запустить".

Добавлено спустя 2 минуты 58 секунд:
Из паскаля вызывать ява программу -это уж слишком.
не уверен что вызывать. Возможно текст "кидать" и ответ получать. Хотя.... хрен редьки не слаще. Для скриптов ещё и браузер тащить (вариант с запуском скрипта без браузера не рассматриваю - проще длл описанные выше).
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как проверить орфографию и пунктуацию?

Сообщение Лекс Айрин » 23.06.2016 17:57:53

pupsik писал(а):почему галочкой не пользуетесь: "автоматом не править" ?


Потому что она мне нужна (не все символы можно ввести с клавы, а копипастой не всегда реально вводить И уж темдолее, мало кто помнит все Alt коды таблицы символов). В моем блокноте эти символы стоят в заметках, поэтому автозамена не нужна в принципе. Вообще, надо будет добавить кнопочек с этими символами...

pupsik писал(а): И подчёркивание не самая худшая проблема.

А как этого добиться в мемо? На самом деле, не обязательно подчеркивать... можно указывать на слово другими методами...
Аватара пользователя
Лекс Айрин
долгожитель
 
Сообщения: 5723
Зарегистрирован: 19.02.2013 16:54:51
Откуда: Волгоград

Re: Как проверить орфографию и пунктуацию?

Сообщение pupsik » 23.06.2016 19:23:54

Вообще, надо будет добавить кнопочек с этими символами...
в общем - лентяйничаем :lol:
А как этого добиться в мемо?
кросс - тяжко. Тем более в мемо. В общем - рисовать видимую часть.
Вроде как richmemo что то должен такое (не уверен). Ну..у и synedit - это ужас. Т.е. кириллица там, мягко говоря, проблемная.
Можно посмотреть в сторону http://wiki.freepascal.org/ATSynEdit. Вроде как нормально должно получиться.

п.с.
Хотя, на данный момент, для меня это не актуальная тема. А когда была актуально - онли мемо был :) Точнее импортировал делфи компонен (уже писал).
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как проверить орфографию и пунктуацию?

Сообщение Лекс Айрин » 23.06.2016 20:16:56

pupsik, моя дача... хочу деревья сажаю... хочу брусчатку кладу)))

pupsik писал(а):Тем более в мемо.


А мне портировать проект в рич/син едит это тихий ужас. Да и нет необходимости. Вообще, можно и подумать... когда (и если) буду список синонимов прикручивать.
Аватара пользователя
Лекс Айрин
долгожитель
 
Сообщения: 5723
Зарегистрирован: 19.02.2013 16:54:51
Откуда: Волгоград

Re: Как проверить орфографию и пунктуацию?

Сообщение azsx » 24.06.2016 02:44:34

нет лично мне надо только проверять 1 переменную на ошибки и исправлять их автоматом. Подчеркивать ничего не надо пока. Я временно написал обработкой внешней java программы (софт же для меня любимого). Я также думал есть нативный под паскаль компонент.
Скорее всего я поступил неверно.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как проверить орфографию и пунктуацию?

Сообщение Лекс Айрин » 24.06.2016 09:14:04

azsx, глянь на сайтах типа исходники.ру
Аватара пользователя
Лекс Айрин
долгожитель
 
Сообщения: 5723
Зарегистрирован: 19.02.2013 16:54:51
Откуда: Волгоград

Re: Как проверить орфографию и пунктуацию?

Сообщение pupsik » 24.06.2016 09:22:58

Хочу небольшую переменную (до 4 тысяч символов, несколько предложений)
вы явно что то путаете. Это не одна переменная, да же если вы всё это богатство в string загрузили.
Я временно написал обработкой внешней java программы (софт же для меня любимого).
т.е. вы уже сделали и оно работает, и вас устраивает?
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как проверить орфографию и пунктуацию?

Сообщение azsx » 24.06.2016 09:36:36

Это не одна переменная, да же если вы всё это богатство в string загрузили.

почему?
вы уже сделали и оно работает, и вас устраивает?

проверку сделал как функцию (жесть пишет файл, потом проверяет, потом читает второй файл). Но программа в целом не готова так как мне сложно в ней логически разобраться.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

След.

Вернуться в Общее

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 14

Рейтинг@Mail.ru