Суббота, 2024-04-20, 00:55
Забайкальские Слова
Главная | Registration | Login Добро пожаловать Гость | RSS
Зайти
Календарь новостей
«  Апрель 2024  »
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
2930
Поискать
Друзья сайта
С места в карьер.

Словари:
На букву А - а из него ссылки на остальные буквы

А вот тут всё в одном флаконе, но файл большой. Можно его открыть, он закачается весь, а затем Файл: Сохранить страницу (File : Save page as...) - и себе на компьютерный диск, и тогда быстрая копия у вас в кармане (в папке, т.е.):
Весь словарь (один большой файл, 4,2 Мб)

Меня зовут Алексей Яшин. Я родился в г. Чита. И жена у меня из Забайкалья. И вообще...

В Одноклассниках есть группа Забайкальцы. А у них есть форум Забайкальский Словарь. И туда забайкальцы сбрасывают воспоминания о забайкальской речи. В очень свободном формате.

Очень трудно найти что-либо в форумах на сайте Одноклассники. Так уж сделан сайт.

По сообщениям забайкальского народа видно, что давно назрела необходимость как-то упорядочить сообщения форума о забайкальских словах

Я попытался это сделать. Разумеется, вручную обработать эту массу слов невозможно. Поэтому я поизобретал, чтобы это автоматизировать. Или полуавтоматизировать.

Алгоритм:

Вручную. С помощью приставного модуля к смотрелке FireFox под названием Scrapbook я сохранил все страницы форума (более 300 сейчас), за исключением самых свежих, которые содержат слова Сегодня и Вчера в дате сообщений.

Программно.
Прошёл сквозь этот материал, собрал все сообщения, очищенные от html-мусора (всякие ненужные слова, только места занимают), в один кусок.

Обработал весь этот кусок так, чтобы выбрать слова, которые не распознаются программным проверщиком орфографии как правильно написанные. В этот список попало большинство забайкальских слов, а также все опечатки, пары слов, написанные без пробела, транслит, и т.п. Некоторые слова, забайкальские, но в форме, которую можно понять как какое-то обычное русское слово, не попали (например "паря", "шара", "браво").

Поэтому составил два списка: обязательные включения (т.е. туда идут "паря", "шара" и т.п.) и исключения (т.е. такие слова как имена собственные, географические названия, опечатки и т.п.). Слово проверяется на принадлежность первому списку, если есть - в словарь, если слова там нет, то проверяется на орфографию, правильно ли оно написано, если неправильно написано, то смотрим в исключения, если нет в исключениях - в словарь.

Слова, попавшие в словарь, сортируются. Затем для каждого слова составляется список сообщений, в которых это слово встречается. Все сводится в общую таблицу, и в таблицы по буквам, с перекрестными ссылками.

Конец алгоритма.

Помощь участников форума нужна, чтобы дополнить список включений и исключений. Это ручная работа.

А также: с помощью компьютерной программы невозможно выяснить, какие слова родственные, и тем более, какая главная форма у группы похожих слов. Поэтому все формы одного и того же слова получаются как отдельные слова (если слово "бравенький" встретилось, а также "бравенькая", "бравенько", "бравенькому" и т.п. - каждое получит свое гнездо). В будущем можно вручную выделять группы родственных слов и объединять их - но это ручная работа, которую на себя могут взять энтузиасты и активные участники форума.

Словари:
Весь словарь (один большой файл, 4,2 Мб)
На букву А - а из него ссылки на остальные буквы

Все сообщения:
Все сообщения форума, отсортированные в хронологическом порядке

Файлы:
Все слова словаря
Обязательные включения
Исключения
Все слова сообщений

Вы можете помочь.
Выписывайте слова в столбик, которые следует исключить из словаря (т.е. они не забайкальские, попали по ошибке, т.е. опечатки обычных слов).
Выписывайте слова в столбик, которые должны быть включены в словарь (т.е. они ошибочно приняты за обычные русские слова).
Эти столбики слов присылайте в гостевую книгу или в форум.

Copyright MyCorp © 2024
Конструктор сайтов - uCoz