Как сделать электронный словарь

Обновлено: 08.07.2024

По идее, сейчас в Инете всяких словариков, хоть завались. Но дело в том, что языков не так то уж и много - на первом месте ангицкий, потом идут неметский, французский и так далее. А что, если вам приспичило использовать какой-то необычный словарь? Ну скажем, русско-эстонский? Под катом есть объяснение, как это можно организовать.

Итак, терпение лопнуло и вы решили собрать всю свою волю в кулак и написать пару строчек кода, чтобы сделать для себя словарик, который можно запихнуть куда угодно. Самый популярный способ использования - мобильный словарь.
Итак, что нам понадобится? Немного смекалки, программа stardict-editor и. и всё. Разбиваем задачу на три части.

Первый этап. Сначала составляем сами слова. Ну. тут уже я не советчик, потому как тут смотрите по ситуции. Если совсем всё плохо, то можно взять в руки толстый бумажный "аналоговый" словарь и перепечатывать слова. слово за словом. Лично я написал небольшую программку-червячок, которая в течении трёх суток скачала большую часть слов с онлайн-словаря и записала мне в базу данных на жёстком диске около 60 тыс слов и фраз. Мне хватит впринципе. Тут уж вы сами.

Второй этап, когда нужно составить текстовый файл. По инструкции, нужно файлик поставить обязательно в кодировке UTF-8 и с расширением .tab, хотя и с обычным текстовым расширением всё работает отлично. Значит, сам файлик должен быть составлен очень просто:

cat кошка\nкот
dog собака\nшафка\nбарбос

Причём, обращаю внимания, что в данном случае \n это не символ новой строки, а текстовая литера, которая в последствии станет новой строкой, но это будет частю перевода. Ну самое обычное - если слово имеет несколько разных переводов, то их нужно записать каждую с новой строки. А чтобы парсер не подумал, что это уже следующее слово, тупо прописываем знак \n.

Третий этап. Генерим сами стардиктовские файлы. Если вы заранее не установили Stardict-Editor, то установите её с помощью apt-get или aptitude. Потом запускаем её:

Хотите создать свой собственный словарь для reword? Тогда Вам необходим Компилятор словарей!

Как пользоваться компилятором? (reword compiler)

reword compiler — это программа, с помощью которой можно создавать словари для программы ReWord. Как же это сделать? Очень просто.

Перво-наперво откроем любой текстовый редактор (настойчиво рекомендую использовать Notepad++), создадим новый текстовый файл.

Первой строчкой у нас будет само слово

Второй строчкой у нас будет определение этого слова

Затем необходимо пропустить одну строку и писать уже следующее слово

Таким образом всё будет выглядеть так:

Итак, у нас готов свой небольшой словарь. Теперь нам необходимо сохранить файл на жёсткий диск и запустить программу Reword Compiler.

Нажимаем на кнопку "выбрать файл" и выбираем созданый нами только что файл.

Затем, заполняем поля ниже. В поле "автор(ы) словаря" пишем авторов словаря (например, В. Даль). В поле "полное название словаря" пишем как можно более полное название (например, "большой советский энциклопедический словарь"). В поле "короткое название словаря" пишем его короткое название (например, "энциклопедический словарь"). В поле "символы ввода" записываем сокращенные обозначения наборов символов. Так, для русскоязычных словарей необходимо написать "ru". Если в Вашем словаре встречаются, например, еще и символы латинского (английского) алфавита, то пишем в это поле "ru, en". С символами вывода аналогичная ситуация. В поле "кодировка исходного файла" необходимо указать кодировку созданного Вами файла. Как правило, если Вы не меняли настроек в Notepad++, это будет ANSI. В поле "Ваше имя" вы вписываете Ваше имя. В поле "о словаре" Вы вписываете всю дополнительную информацию, которая, как Вы считаете, является полезной.

Внимание! Из всех полей обязательными для заполнения являются только "выбрать файл", "полное название словаря", "короткое название словаря", "символы ввода" и "кодировка исходного файла".

Как только мы убедились, что все необходимые поля заполнены корректно, мы можем запускать компиляцию, нажав кнопку "компилировать".

Словарь будет находиться в папке dictionaries, а папка эта находится в рабочей папке reword compiler.

Чтобы увидеть, как работает наш словарь, скопируем файл из папки компилятора dictionaries в папку со словарями программы-словаря reword (тоже dictionaries).

После запуска программы-словаря reword мы видим свой словарь самым первым и радуемся :)

Обязательно необходимо заметить, что определения слов поддерживают базовую разметку HTML.

Создание словарей с мультимедиа

Создавать словари с мультимедиа несложно. Необходимо лишь в определении слова указать с помощью специального обозначения имя файла с мультимедиа. Делается это так:

Как Вы видите, нужно всего-лишь обнести специальным знаком (тегом ) название файла, и reword compiler воспримет buki.jpg как файл мультимедиа (рисунок) и включит его в словарь. Необходимо заметить, что для корректного создания словарей с мультимедиа файл с мультимедиа должен находиться в той же папке, что и текстовый файл, указанный в поле "выбрать файл".

Если у Вас есть какие-либо вопросы, связанные с использованием компилятора словарей, задавайте их на страничке "Контакт". Я Вам обязательно отвечу.

Я несколько раз создавала Словари Терминов в компаниях. Самый масштабный из них — Словарь Терминов Олимпийских Игр, мы разработали его в Оргкомитете Сочи 2014. Это компания-организатор Олимпийских и Паралимпийских Игр в Сочи в 2014 году. В Оргкомитете я руководила департаментом управления знаниями. Эту инструкцию буду иллюстрировать скриншотами того самого проекта.

Зачем и когда нужен?

Если суммировать уже сказанное выше, Словарь Терминов вам поможет в случае:

С чего начать?

Начинайте с определения цели и понимания результатов. Например, для этого можно использовать чек-лист из утверждений выше. Возможно, вы дополните его и своими причинами. Оцените каждую по пятибалльной шкале. Попросите коллег также заполнить этот чек-лист. Обсудите и проанализируйте результаты: какие утверждения набрали максимальные веса? Это и есть цель создания вашего словарика.

Внимание!

Не приступайте к созданию Словаря, пока не определили цели (и задачи). Они, в свою очередь, должны быть понятны и приняты конечными потребителями.

Теперь поговорим о результате. Оценить и измерить качество Словаря очень важно. Иначе — как вы поймёте, что он сделан наилучшим образом и действительно полезен? Результат можно измерить тремя способами. Самый простой — по его посещаемости. Например, по количеству посетителей в период времени, продолжительности использования одним посетителем, идей и предложений, словом — по вовлечённости его пользователей.

Начинайте с определения цели и понимания результатов

И третий — оцените результативность и влияние словаря на те бизнес-процессы или проекты, которые вы определили в своих целях. То есть оцените целевые результаты. Изменилась ли ситуация к лучшему? Спросите об этом пользователей и всех заинтересованных. Подробнее про измерения и оценки Словаря читайте дальше.

Для полноты картины используйте все три способа.

Внимание!

Планируйте оценку, анализ результатов и нужные метрики заранее, на самом начальном этапе.

10 простых шагов для создания отличного словаря

Перед нами дорожная карта создания Словаря, который будет очень полезен вашей компании. Следуйте по карте, и вы создадите удобный и ценный Словарь Терминов.

Говорим на одном языке. Как создать словарь терминов: 10 шагов

Рисунок 1. Маршрутная карта создания Словаря Терминов

Именно так мы и действовали в Оргкомитете. Прежде всего, мы описали алгоритм создания Словаря (примерно такой, как на Рисунке 1) и представили его вице-президентам и директорам, чтобы получить их поддержку. Теперь, когда мы вовлекли заинтересованные стороны, можно было приступать к сбору терминов.

Шаг 2. Собираем команду

Оцените результативность и влияние словаря на те бизнес-процессы или проекты, которые вы определили в своих целях

Поскольку о цели мы уже поговорили, переходим ко второму шагу. Очень частая ошибка — не привлекать будущих пользователей к созданию продукта. Обязательно советуйтесь с ними и по возможности максимально вовлеките их в процесс. Например, вы можете еженедельно проводить короткие встречи, покажите, что уже сделано, спросите совета и рекомендаций.

Но, даже если у вас нет возможности активно вовлечь бизнес-направления в создание Словаря, обязательно информируйте их о ваших намерениях и целях. Хорошо бы провести для этого kick-off проекта с участием будущих пользователей.

В Оргкомитете к тому времени уже сложилась группа сотрудников из всех бизнес-направлений, неравнодушное активное меньшинство, агенты изменений. Так началось формирование профессионального сообщества Координаторов Знаний. Сбор терминов и понятий своего бизнес-направления и создание Словаря Терминов стали одними из первых задач будущих Координаторов.

Внимание!

Вовлекайте будущих пользователей Словаря в его создание. Тогда вы избежите риска ошибок и неприятия ими конечного продукта.

Шаг 3. Собираем термины

Приступаем к созданию словаря. Для начала создадим простой шаблон для сбора и описания понятий. Это упростит задачу бизнес-направлениям и значительно сократит ваше время по обработке терминов.

Например, используйте вот такой. На этом скриншоте четыре термина бизнес-направления управление знаниями. Словарь Терминов в Оргкомитете был двуязычным.

Говорим на одном языке. Как создать словарь терминов: 10 шагов

Рисунок 2. Шаблон для Словаря Терминов, пример бизнес-направления управление знаниями

Внимание!

Обязательно создайте простой шаблон, чтобы бизнес-направления его заполнили. Это упростит задачу для всех участников, в том числе и для вас.

Даже если у вас нет возможности активно вовлечь бизнес-направления в создание Словаря, обязательно информируйте их о ваших намерениях и целях

Внимание!

Подумайте о мотивации ваших соучастников, как их поощрить и наградить. Возможно, спросите самих соучастников — что для них важно?

Если такого сообщества помощников у вас пока не сложилось, вероятнее всего, придется договариваться с руководителями бизнес-направлений. Они предложат кого-то из сотрудников.

Внимание!

Максимально сократите время, необходимое бизнес-направлениям для заполнения шаблона. Хорошо бы сразу привести примеры описаний.

Шаг 4. Анализируем термины и понятия

Тем или иным способом вы получили заполненные шаблоны с терминами. Проанализируйте их — есть ли повторения? Одинаковые толкования разных терминов? Одни и те же термины, но с разным толкованием? Именно все они и есть предмет следующего и очень важного этапа работы — согласования и поиска формулировок, принятых разными бизнес-направлениями. Выпишите все спорные термины. Назначьте время для обсуждения.

В Оргкомитете Сочи 2014 первоначально мы собрали 940 терминов и понятий. В конечную версию Словаря 700 из них. Около 200 понятий после анализа были объединены или исключены.

Внимание!

Проанализируйте список, выделите спорные термины, пригласите авторов на встречу.

Проведите короткую встречу, расскажите о сути проекта, объясните задачи, поставьте сроки

Шаг 5. Уточняем формулировки

Описания терминов должны быть максимально понятны и просты. Термины нужны для облегчения взаимодействий, а не для сложностей взаимопонимания. Поэтому спорные термины важно обсудить со всеми заинтересованными сторонами. И здесь вам потребуется мастерство модерации и немного фасилитации, чтобы создать условия для результативного обсуждения.

Со спорными терминами можно поступить двумя способами. Если это возможно — переформулировать термин, чтобы учесть все его характеристики и толкования. Это получится, когда речь идёт об одном и том же понятии, но его рассматривают с разных сторон. В этом процессе важно участие руководителей бизнес-направлений.

Иногда один и тот же термин означает разные понятия или процессы. Если не удаётся договориться, можно включить в Словарь два термина с аббревиатурами бизнес-направлений.

Внимание!

Обязательно обсудите и переформулируйте спорные термины с участием заинтересованных сторон.

Шаг 6. Пишем ТЗ

Сами термины и понятия можно расположить в алфавитном порядке, а можно разбить по бизнес-направлениям. В Оргкомитете Сочи 2014 мы применили второй способ.

Содержание вашего ТЗ может быть примерно таким.

Говорим на одном языке. Как создать словарь терминов: 10 шагов

Рисунок 3. Содержание ТЗ Словаря Терминов

Внимание!

Подумайте, как максимально упростить использование Словаря и сделать его доступным для всех, кому он важен. Учтите это при написании ТЗ.

Шаг 7. Определяем правила обновления

Словарь, как и язык, изменяется. Возникают новые понятия, некоторые термины не используются, а часть может со временем приобрести другой смысл. Чтобы Словарь оставался живым, его нужно актуализировать. Можно делать это регулярно, раз в полгода, или же по необходимости.

В Оргкомитете мы составили документ с описанием правил дополнения и обновления Словаря. И даже нарисовали схему бизнес-процесса его актуализации (Рисунок 4).

Говорим на одном языке. Как создать словарь терминов: 10 шагов

Рисунок 4. Описание бизнес-процесса обновления Словаря Терминов

Я очень рекомендую визуализировать бизнес-процессы. Это не займёт много времени, а результат очень наглядный, он понятен и хорошо воспринимается. Как пример — схема из Оргкомитета. Хотя, это и не лучший вариант. Самая главная цель описания процесса — понимание, простота и чёткость обновления. Поэтому и схема должна быть наглядной, простой, красивой.

В Оргкомитете за актуализацию Словаря отвечали Координаторы Знаний.

А вот так могут выглядеть поля для обновления Словаря:

Говорим на одном языке. Как создать словарь терминов: 10 шагов

Рисунок 5. Обновление Словаря Терминов

Внимание!

Обязательно определите правила, опишите процесс и назначьте ответственных за обновление.

Шаг 8. Разрабатываем и публикуем словарь в общедоступном пространстве

Этот шаг — как подведение итогов всех предыдущих действий. Вы собрали, проанализировали, обсудили термины и понятия компании. Описали порядок их обновления. Написали ТЗ и передали его в работу. И теперь нужно разместить Словарь на сетевом ресурсе, например, в Интранет. Для него не нужно специальных технологий, используйте те, что уже есть.

Затем вы регулярно смотрите версии Словаря, чтобы тестировать их и постепенно привести к вашей задумке. Например, как на Рисунке 6.

Говорим на одном языке. Как создать словарь терминов: 10 шагов

Рисунок 6. Словарь Терминов на Интранет портале

Спорные термины важно обсудить со всеми заинтересованными сторонами

Шаг 9. Информируем всех-всех-всех

Если вы думаете, что слава о Словаре разлетится по компании с помощью сарафанного радио, то я вас разочарую. Впоследствии так оно и будет, но не на первых порах. Только малый процент людей готов самостоятельно искать и применять новые инструменты, даже если они очень нужны. Чаще всего их не больше 10–12%.

Отнеситесь к этой задаче как к продвижению изменений.

Шаг 10. Анализируем и оцениваем результаты

Итак, мы создали Словарь Терминов, и теперь важно протестировать и оценить его результативность. Тогда будет понятно — нужен ли этот инструмент (вдруг мы переоценили его важность?), а также насколько хорошо мы его сделали. Можно попросить добровольцев, необязательно из числа вашей группы поддержки, тестировать Словарь и найти как можно больше возможностей для его улучшения. Для этого хорошо организовать конкурсы или викторины.

Только малый процент людей готов самостоятельно искать и применять новые инструменты, даже если они очень нужны

В Оргкомитете мы не проводили специальных тестов, а сразу запустили Словарь для общего использования. Это было из-за 100% уверенности в его нужности и срочности задачи. Словарь очень ждали все бизнес-направления. Не случайно он стал первым инструментом Интранет-портала. Результативность Словаря мы измеряли двумя способами. Во-первых, наблюдали за вовлечённостью посетителей. Мы заметили, что первые две-три недели на страницу Словаря Терминов заходили примерно 25% сотрудников. В основном, это были те, кто принимал участие в его создании. Стало понятно, что Словарь недостаточно хорошо известен. Тогда мы провели еще две–три акции — короткую презентацию Словаря для всех желающих (участвовали примерно 35% сотрудников), а также рассказали о нем на общем собрании. Посещаемость повысилась до 45%. Постепенно, с приходом новичков она росла и достигла 60%.

И тогда мы попросили этих посетителей ответить на три простых вопроса. с оценкой по шкале 5 баллов. Часто ли они используют Словарь? Удобно ли его использовать? Помогает ли Словарь Терминов в их работе? Мы также попросили рассказать короткие кейсы, когда Словарь сделал их работу более успешной. 90% участников опроса (а это были 60% сотрудников Оргкомитета) оценили Словарь на 8–9 баллов из 10, 15 человек прислали свои идеи и предложения. Мы также получили 5 историй, когда Словарь помог выполнить работу лучше.

Подводим итоги

В момент создания Словаря Терминов в Оргкомитете он включал 940 терминов и понятий. В конечную версию вошли 700 из них, из которых почти 400 были общими, широко распространенными терминами, обязательными для всех бизнес-направлений. Около 200 терминов мы объединили с другими или переформулировали. Координаторы Знаний в бизнес-направлениях регулярно дополняли Словарь, и он помогал коммуницировать, взаимодействовать, выполнять многофункциональные проекты вплоть до февраля 2014 — до самых Игр.

Привет всем, кто сюда будет заглядывать. Предлагаю совместными усилиями разработать простенький англо-русский словарь.
Примитивный интерфейс пока имеет вид, представленный на рисунке во вложении.
Данные для "словаря" берутся из текстового файла (самописного), где английское слово и его перевод разделеными символом '=' (равно); в том случае, если слово содержит несколько значений, то слова на русском языке разделены символом табуляции '\t'.
Работа приложения пока представлена следующим образом:
1) при старте программы осуществляется загрузка данных из текстового файла;
2) далее в массив "words" типа "string" на четные позиции (начиная с индекса 0) помещается английское слова, а на нечётное (начиная с индекса 1) - русское, которое может содержать несколько значений;
3) далее в список (comboBox) с английскими словами помещаются элементы списка "words", стоящие на чётных позициях, а вот данные с русскими словами (то есть перевод) ПОКА помещаются в массив;
4) далее при выборе элемента списка comboBox осуществляется выборка из массива с переводом, и, если перевод имеет несколько значений, осуществляется его "разбивка" через символ '\t' (табуляции) и вывод построчно в textBox.
Пока что так, в очень сыром виде.
Жду советов по улучшению и/или оптимизации и увеличении быстродействия программы. У меня тут уже назрел один вопрос - как лучше хранить данные из текстового файла внутри программы? Может использовать Dictionary вместо массива? Или создавать какие-либо классы, структуры?
В дальнейшем планируется организовать добавление пользователем своих слов с переводом или слов без перевода или же добавление переводов к словам, у которых уже есть перевод.
Ещё раз повторясь, что пока разрабатывается простая программа, поэтому прошу не размещать здесь советы по увеличению функционала, так как promt, lingvo и прочие уже есть, а здесь я предлагаю написать свой простенький переводчик.
А чуть не забыл, исходный код и файл с усечённым словарём во вложении:

Откуда можно взять англо-русский словарь в txt?
Для практики пишу небольшой словарь, и совершенно без понятия от куда взять нормальный словарь для.

Англо-русский словарь
Всем привет. Мне нужен словарь, как вы уже догадались из названия темы. Желательно чтобы он был в.

Да вы батенька извращенец

Юзай регулярные выражения для парсинга текста, так проще

когда количество слов в словаре будет исчислятся тысячами, прога с таким подходом будет дико тормозить. Предлагаю юзать БД.

когда количество слов в словаре будет исчислятся тысячами, прога с таким подходом будет дико тормозить. Предлагаю юзать БД.

Читайте также: