Википедия:Гомуми форум: юрамалар арасында аерма

Контент бетерелгән Контент өстәлгән
Qdinar (бәхәс | кертем)
Qdinar (бәхәс | кертем)
Юл номеры - 1204:
::: Вы уверены, что "отловить" все тюркские или же русско-европейские слова - реальная задача (в особенности учитывая, что к заимствованным корням аффиксы всё равно татарские присоединяются)? Может проще сделать просто обширный список исключений и пополнять его время от времени? У меня в крымскотатарском скрипте около 300 исключений для направления кириллица > латиница, и около 400 для направления латиница > кириллица. И 99,9% текста обрабатывается корректно. Думаю, что в вашем случае тоже меньше чем тысячью исключений для каждого направления можно будет обойтись. [[Кулланучы:Don Alessandro|Don Alessandro]] ([[Кулланучы бәхәсе:Don Alessandro|бәхәс]]) 25 апр 2018, 11:01 (UTC)
:::: я тоже отлавливаю обширный список исключений. но не такой "обширный", как у вас, смотрите абзац ниже. просто у вас использован массив, а я пока не использую массив, а добавляю в строку. для постоянного пополнения исключений, насколько я знаю, хоть так, хоть так, процесс одинаковый, у вас же нету наверно в интерфейсе википедии окна для добавления исключений.
:::: тут надо сказать, я видел, что в вашем списке исключений одни и те же корни с различными суффиксами, очевидно, таким образом очень трудно будет добавить все формы слов, и очень большой список надо будет. а в моем я ловлю по началу слов и суффиксы затем отдельно отделяю. <s>так что, думаю, мой скрипт до последних изменений наверно правильно конвертировал бо'льшую часть текстов, чем ваш.</s>
:::: отлавливать слова заимствованные из (включая "через") русского языка я попытался, как я уже сказал, а теперь пытаюсь отловить "твердые" тюркско-татарские слова, которые иначе могли пойти в "русские" слова, и для этого я сделал проверку всех возможных суффиксов.
:::: --[[Кулланучы:Qdinar|QDinar]] ([[Кулланучы бәхәсе:Qdinar|бәхәс]]) 25 апр 2018, 13:04 (UTC)