С места в карьер. Словари: На букву А - а из него ссылки на остальные буквы А вот тут всё в одном флаконе, но файл большой. Можно его открыть, он закачается весь, а затем Файл: Сохранить страницу (File : Save page as...) - и себе на компьютерный диск, и тогда быстрая копия у вас в кармане (в папке, т.е.): Весь словарь (один большой файл, 4,2 Мб) Меня зовут Алексей Яшин. Я родился в г. Чита. И жена у меня из Забайкалья. И вообще... В Одноклассниках есть группа Забайкальцы. А у них есть форум Забайкальский Словарь. И туда забайкальцы сбрасывают воспоминания о забайкальской речи. В очень свободном формате. Очень трудно найти что-либо в форумах на сайте Одноклассники. Так уж сделан сайт. По сообщениям забайкальского народа видно, что давно назрела необходимость как-то упорядочить сообщения форума о забайкальских словах Я попытался это сделать. Разумеется, вручную обработать эту массу слов невозможно. Поэтому я поизобретал, чтобы это автоматизировать. Или полуавтоматизировать. Алгоритм: Вручную. С помощью приставного модуля к смотрелке FireFox под названием Scrapbook я сохранил все страницы форума (более 300 сейчас), за исключением самых свежих, которые содержат слова Сегодня и Вчера в дате сообщений. Программно. Прошёл сквозь этот материал, собрал все сообщения, очищенные от html-мусора (всякие ненужные слова, только места занимают), в один кусок. Обработал весь этот кусок так, чтобы выбрать слова, которые не распознаются программным проверщиком орфографии как правильно написанные. В этот список попало большинство забайкальских слов, а также все опечатки, пары слов, написанные без пробела, транслит, и т.п. Некоторые слова, забайкальские, но в форме, которую можно понять как какое-то обычное русское слово, не попали (например "паря", "шара", "браво"). Поэтому составил два списка: обязательные включения (т.е. туда идут "паря", "шара" и т.п.) и исключения (т.е. такие слова как имена собственные, географические названия, опечатки и т.п.). Слово проверяется на принадлежность первому списку, если есть - в словарь, если слова там нет, то проверяется на орфографию, правильно ли оно написано, если неправильно написано, то смотрим в исключения, если нет в исключениях - в словарь. Слова, попавшие в словарь, сортируются. Затем для каждого слова составляется список сообщений, в которых это слово встречается. Все сводится в общую таблицу, и в таблицы по буквам, с перекрестными ссылками. Конец алгоритма. Помощь участников форума нужна, чтобы дополнить список включений и исключений. Это ручная работа. А также: с помощью компьютерной программы невозможно выяснить, какие слова родственные, и тем более, какая главная форма у группы похожих слов. Поэтому все формы одного и того же слова получаются как отдельные слова (если слово "бравенький" встретилось, а также "бравенькая", "бравенько", "бравенькому" и т.п. - каждое получит свое гнездо). В будущем можно вручную выделять группы родственных слов и объединять их - но это ручная работа, которую на себя могут взять энтузиасты и активные участники форума. Словари: Весь словарь (один большой файл, 4,2 Мб) На букву А - а из него ссылки на остальные буквы Все сообщения: Все сообщения форума, отсортированные в хронологическом порядке Файлы: Все слова словаря Обязательные включения Исключения Все слова сообщений Вы можете помочь. Выписывайте слова в столбик, которые следует исключить из словаря (т.е. они не забайкальские, попали по ошибке, т.е. опечатки обычных слов). Выписывайте слова в столбик, которые должны быть включены в словарь (т.е. они ошибочно приняты за обычные русские слова). Эти столбики слов присылайте в гостевую книгу или в форум.
|