Словари:
На букву А - а из него ссылки на остальные буквы
А вот тут всё в одном флаконе, но файл большой. Можно его открыть, он закачается весь, а затем Файл: Сохранить страницу (File : Save page as...) - и себе на компьютерный диск, и тогда быстрая копия у вас в кармане (в папке, т.е.):
Весь словарь (один большой файл, 4,2 Мб)
Меня зовут Алексей Яшин. Я родился в г. Чита. И жена у меня из Забайкалья. И вообще...
В Одноклассниках есть группа Забайкальцы. А у них есть форум Забайкальский Словарь. И туда забайкальцы сбрасывают воспоминания о забайкальской речи. В очень свободном формате.
Очень трудно найти что-либо в форумах на сайте Одноклассники. Так уж сделан сайт.
По сообщениям забайкальского народа видно, что давно назрела необходимость как-то упорядочить сообщения форума о забайкальских словах
Я попытался это сделать. Разумеется, вручную обработать эту массу слов невозможно. Поэтому я поизобретал, чтобы это автоматизировать. Или полуавтоматизировать.
Алгоритм:
Вручную. С помощью приставного модуля к смотрелке FireFox под названием Scrapbook я сохранил все страницы форума (более 300 сейчас), за исключением самых свежих, которые содержат слова Сегодня и Вчера в дате сообщений.
Программно.
Прошёл сквозь этот материал, собрал все сообщения, очищенные от html-мусора (всякие ненужные слова, только места занимают), в один кусок.
Обработал весь этот кусок так, чтобы выбрать слова, которые не распознаются программным проверщиком орфографии как правильно написанные. В этот список попало большинство забайкальских слов, а также все опечатки, пары слов, написанные без пробела, транслит, и т.п. Некоторые слова, забайкальские, но в форме, которую можно понять как какое-то обычное русское слово, не попали (например "паря", "шара", "браво").
Поэтому составил два списка: обязательные включения (т.е. туда идут "паря", "шара" и т.п.) и исключения (т.е. такие слова как имена собственные, географические названия, опечатки и т.п.). Слово проверяется на принадлежность первому списку, если есть - в словарь, если слова там нет, то проверяется на орфографию, правильно ли оно написано, если неправильно написано, то смотрим в исключения, если нет в исключениях - в словарь.
Слова, попавшие в словарь, сортируются. Затем для каждого слова составляется список сообщений, в которых это слово встречается. Все сводится в общую таблицу, и в таблицы по буквам, с перекрестными ссылками.
Конец алгоритма.
Помощь участников форума нужна, чтобы дополнить список включений и исключений. Это ручная работа.
А также: с помощью компьютерной программы невозможно выяснить, какие слова родственные, и тем более, какая главная форма у группы похожих слов. Поэтому все формы одного и того же слова получаются как отдельные слова (если слово "бравенький" встретилось, а также "бравенькая", "бравенько", "бравенькому" и т.п. - каждое получит свое гнездо). В будущем можно вручную выделять группы родственных слов и объединять их - но это ручная работа, которую на себя могут взять энтузиасты и активные участники форума.
Словари:
Весь словарь (один большой файл, 4,2 Мб)
На букву А - а из него ссылки на остальные буквы
Все сообщения:
Все сообщения форума, отсортированные в хронологическом порядке
Файлы:
Все слова словаря
Обязательные включения
Исключения
Все слова сообщений
Вы можете помочь.
Выписывайте слова в столбик, которые следует исключить из словаря (т.е. они не забайкальские, попали по ошибке, т.е. опечатки обычных слов).
Выписывайте слова в столбик, которые должны быть включены в словарь (т.е. они ошибочно приняты за обычные русские слова).
Эти столбики слов присылайте в гостевую книгу или в форум.