Как сделать конкорданс

Добавил пользователь Алексей Ф.
Обновлено: 04.10.2024

Конкорданс – это список всех употреблений заданного языкового выражения (например, слова) в контексте, возможно, со ссылками на источник. В этом значении данный термин широко используется в корпусной лингвистике. Поиск в корпусе данных позволяет по любому слову построить конкорданс – список всех употреблений данного слова в контексте со ссылками на источник. Обычно конкордансом называют список примеров, полученных в результате поиска по корпусу интересующего пользователя языкового выражения со ссылками на источник.

В первом своем значении этот термин также употребляется для обозначения списка ключевых слов книги или работы, расположенных в алфавитном порядке, с их непосредственными контекстами.

Первый конкорданс, к Вульгате, был создан в 13 веке Хьюго де Сент-Шером (Hugues de Saint-Cher), которому помогали 500 монахов.

Именно из-за объёма работы по составлению конкордансов в докомпьютерные времена конкордансы были созданы только для трудов высочайшей важности – Вед, Библии, Корана или произведений У.Шекспира.

Даже с использованием компьютера создание конкорданса является трудоёмкой работой, так как конкордансы часто включают комментарии, определения слов или интертекстуальные ссылки – материалы, которые пока невозможно получить автоматически.

Двуязычные конкордансы – это конкордансы, основанные на параллельных текстах.

Тематические конкордансы – это списки тем, которые охватывает книга, с содержанием сути этих тем. Наиболее известный из таких конкордансов – Nave's Topical Bible.

Конкорданс (в первом упомянутом значении) является одним из основных понятий корпусной лингвистики. Конкордансы часто используются в прикладной лингвистике: в лексикографии, при анализе текста, при обучении и изучении языка, при переводе.

Конкордансы используются для решения следующих лингвистических задач:

  • сравнение различных использований одного слова,
  • анализ ключевых слов,
  • анализ частотности слов и словосочетаний,
  • поиск и исследование фраз и идиом,
  • поиск перевода, например, терминологии,
  • создание списков слов (что используется при публикации).

Существуют специальные программы составления конкордансов по некоторому корпусу текстов, так называемые конкордансеры. Они позволяют получать частоту той или иной языковой единицы по произвольному корпусу текстов, список контекстов, в которых данная единица встретилась. Многие из них позволяют также сортировать контексты по ключевому слову (в исходной форме) или по словоформе, по ближайшему контексту (фрагмент конкорданса для слова bag, см. Пример конкорданса.PPT)

TextSTAT - Simples Text Analyse Tool - конкордансер, работающий с корпусами на разных языках, с использованием специального языка запросов (языка регулярных выражений)

Редактор статьи Архипов Александр Владимирович, кандидат филологических наук, доцент филологического факультета МГУ.

Под Concordance (от лат . Concordare "совпадение") относится к текстовым наукам, традиционно представляющим собой алфавитный список ключевых слов и фраз , которые используются в письменной работе. Термин происходит от библейских исследований , сегодня он также играет существенную роль в литературоведении и в смежных дисциплинах, а совсем недавно, в корпусной лингвистике , суб-области лингвистики . В последнем случае согласование также может влиять на слова и фразы из устных текстов.

Сегодня согласования обычно представляют собой электронные списки совпадений, которые обычно возникают в результате поиска слова или фразы, но фактически в результате поиска любой определяемой строки символов. В согласовании обычно дается ближайшая лингвистическая среда искомого термина, так называемый контекст , например, все предложение, в котором встречается искомое слово.

Содержание

Создание


До появления современной обработки данных создание согласований было очень трудоемким, трудоемким и, следовательно, дорогостоящим. Поэтому согласования создавались только для произведений, представляющих особый интерес, таких как религиозные тексты ( Библия , Коран , Ригведа ) или для произведений великих писателей (например, Уильяма Шекспира ). Еще в средние века были созданы сборники документов для Библии, но также и для канонических текстов с использованием латинского выражения concordantia .

Типологически по сей день существует два варианта:

  • Вербальные соответствия дают алфавитный порядок всех встречающихся слов и идиом с указанием отрывка текста.
  • Настоящие согласования обеспечивают компиляцию на основе содержания всех отрывков, относящихся к определенной мысли или объекту.

Поскольку наиболее важные литературные произведения теперь доступны в оцифрованной форме, согласования теперь обычно создаются с помощью программного обеспечения , которое обеспечивает удобный поиск слов и фраз - аналогично поисковой системе в World Wide Web ( полнотекстовый поиск ). Уже существует большое количество различных продуктов, предназначенных для разных целей - для Библии, например, целый ряд библейских программ и для корпусной лингвистики, например, WordSmith . Такое программное обеспечение может также опционально работать в режиме онлайн. Полнотекстовый поиск во многих других оцифрованных текстах, таких как словари , энциклопедии и литературные сборники, также соответствует этому принципу. В корпусной лингвистике, развитие которой стало возможным только благодаря современным цифровым технологиям, согласования получают либо из корпусов текстов, специально разработанных для конкретного исследовательского проекта, либо из заранее подготовленных коллекций текстов, которые часто также доступны в Интернете.

Ранние электронные согласования были опубликованы в печатной форме, например, о греческих поэтах Гесиоде и Гомере с 1977 года. Они уже имели форму представления, которая сегодня является обычной в компьютерных согласованиях . В этом случае контрольная точка состоит из одной строки, а соответствующий поисковый запрос находится посередине. Однако в сегодняшних электронных согласованиях отображаемый объем текста, окружающего поисковый запрос, часто можно изменить (например, любое количество строк, целое предложение или целый абзац).

Различия между традиционными и электронными согласованиями

С помощью электронных согласований можно преодолеть некоторые ограничения предыдущих согласований. В частности, изменился акцент на отдельные слова:

  • Отдельные слова традиционно отбирались для поиска в корпусе на основе содержательной оценки человеком, что сегодня является чужой точкой зрения.
  • Отдельные слова были сокращены от их текущей формы к их основной форме, то есть спряганным и склоненным словоформам к их соответствующей основной форме. Сегодня в центре внимания и конкретные словоформы.
  • Отправной точкой поиска должно быть не только одно слово, но и весь текст может быть определен как критерий поиска. Потому что отдельные слова всегда встраиваются в цепочки слов, и можно автоматически проверить, используется ли одно слово из определенной цепочки чаще в остальной части корпуса. Взгляд идет от грамматических конструкций до пустых фраз, от формул до цитат и плагиата.

Конкордансы, созданные с использованием современных технологий, больше не соответствуют в нескольких отношениях традиционной модели печатного согласия:

  • Полнота: в электронных согласованиях всегда перечисляются документы в корпусе полностью - если не предусмотрено иное.
  • Критерий поиска: обычные соответствия основаны на поиске терминов , связанных с содержанием , в то время как соответствия из цифровых корпусов перечисляют отдельные словоформы (хотя рассматриваемый термин и его словоформа также могут быть идентичными в письменной форме). Можно ли и как построить мост к условной согласованности (включению значений) ( лемматизация ключевых слов ) в настоящее время все еще остается методологической проблемой в филологической сфере.
  • Параметры поиска: в отличие от классического метода поиска, цифровые корпуса предлагают очень гибкую структуру поиска. В них, например, вы можете искать не только отдельные словоформы, но и любые цепочки слов (которые не обязательно должны быть фразой в грамматическом смысле), а также сочетания слов, которые не должны появляться в виде цепочки в корпусе текста.

Программное обеспечение Concordance


Для языкового анализа существует ряд различных программных продуктов. В дополнение к так называемым тэгерам (для аннотирования корпусов) и синтаксическим анализаторам (для их синтаксического анализа) существует ряд конкордансеров для генерации согласований из корпуса , которые очень по-разному разработаны и спроектированы таким образом, чтобы соответствовать соответствующим требованиям отдельных областей научных исследований.

Например, программа согласования CoMOn , которая в первую очередь отвечает филологическим потребностям, позволяет проверять связь целого отдельного текста длиной до нескольких тысяч символов с окружающим корпусом, при этом совпадения также могут выводиться как соответствия, которые варьируются от указанного поискового текста до в определенной степени различаются. Программа также автоматически распознает, до какой длины совпадают строки слов. С другой стороны, такие программы, как Wordsmith Tools или AntConc, которые в основном используются в лингвистике , предлагают не только создание согласований, но также ряд других функций, таких как анализ коллокаций , лемматизация, извлечение ключевых слов или вывод статистических данных по корпусу, таких как отношение типа-токена .

использовать

В зависимости от научной дисциплины, вопроса исследования , типа используемого программного обеспечения и дизайна согласования (выбранный корпус текста, отдельный термин или фраза, объем рассматриваемого лингвистического контекста) согласования могут использоваться по-разному. При перечислении определенного отдельного термина его можно определить, например,

  • В библейских исследованиях (посредством библейских согласований ), в каких местах определенный термин появляется в разных изданиях Библии, из чего можно сделать выводы о практике перевода на разные языки
  • в литературоведении, как часто, в каких произведениях и в каком контексте поисковый термин используется определенным писателем, который считается частью определенного языка, характерного для человека ( идиолект )
  • При написании словаря различные значения, в которых определенное слово встречается в определенном языке, из которых может быть получен диапазон значений определенного термина, а также, что также важно для исторической лингвистики, могут быть описаны явления языкового изменения с течением времени.
  • В общей лингвистике, в каких формах склонения или с какими другими словами обычно используется определенное слово, которое может использоваться , например, для доказательства различного использования в письменной и устной речи
  • В исследованиях преподавания языков - степень, в которой определенное выражение часто используется грамматически правильно или неправильно при изучении иностранного языка, что влияет на дизайн учебных материалов, например

Используя современные технологии, также могут быть созданы согласования любых определенных групп из нескольких лингвистических символов или слов ( N-граммы ). Таким образом можно определить, встречаются ли и в каких текстах какие словосочетания (словосочетания) предпочтительно. Таким образом можно распознать идиоматические выражения, использование шаблонного языка, цитаты, аллюзии и т. Д., Что представляет особый интерес в соответствующих областях науки.

Смотри тоже

литература

Индивидуальные доказательства

веб ссылки

Викисловарь: Concordance - объяснение значений, происхождения слов, синонимов, переводов

    Эта страница последний раз была отредактирована 25 июня 2018 в 20:27.

Согласование гибкая программа анализа текста, который позволяет получить более полное представление электронных текстов и анализировать язык объективно и в глубину. Ее позволяет рассчитывать словами, сделать списки слов, списков слов частот и индексов. Она имеет широкое применение в контент-анализа, языкового строительства, лингвистики, интеллектуальный анализ данных, лексикографии, перевода, а также многочисленные торговые площади и академических дисциплин. Это может сделать полный согласований и такого качества, показывая каждое слово в контексте, обработки текстов практически любого размера. Это можно сделать быстро согласований, выбор ваш выбор слов из текста для облегчения целевого анализа. Вы можете просмотреть полный список слов, согласование, и ваш оригинальный текст одновременно, и просматривать исходный текст и нажмите на любое слово, чтобы увидеть все вхождения этого слова в контексте. Вы можете анализировать текст напрямую из других программ для Windows через буфер обмена, или использовать несколько входных файлов. Вы можете сделать веб-Конкордансы, превращая ваш анализ в связанных HTML файлов с одним щелчком мыши. Лемматизатор позволяет группировать любые слова, которые вы выбираете по смежным темам. Словосочетания отображения показывает, какие слова наиболее часто возникают рядом с другим. Комплектование и остановить списки позволяют указать слова, которые будут включены или исключены из анализа. Согласование работает практически со всеми языками, поддерживаемыми Windows. Алфавит и контексты определяются пользователем. Определяемых пользователем системы отсчета может позволить вам определить, какие части текста каждое слово приходит и логических категорий по своему выбору он принадлежит. Вы можете выбрать и сортировать слова по-разному, поиск фразы, делать близость поиск, выборка слов, и делать поиск регулярного выражения. Смотреть статистику по тексту, в том числе слова типа, жетоны, и проценты, типа / знак отношения, характер и предложения графов и диаграмм длина слова. Существует полный предварительного просмотра и печати, с контролем над размером страницы, полей, колонтитулы и шрифты. Это наиболее гибкая и мощная программа для анализа текста.

Что нового в этой версии: Improved usability features; bug fixes

Антивирус информации

Download3k скачал и испытаны Concordance, 11 Apr 2012 года с некоторыми из лучших антивирусных ядер настоящее время и вы можете найти ниже, для вашего удобства, результаты проверки:

Словарь иностранных слов.- Комлев Н.Г. , 2006 .

Толковый словарь иностранных слов Л. П. Крысина.- М: Русский язык , 1998 .

Полезное

Смотреть что такое "КОНКОРДАНС" в других словарях:

конкорданс — а, м. concordance, нем. Konkordanz <лат. concordare согласовываться, находиться в соответствии. Лингв. Словарь перечень контекстов употребления слов. РР 1984 № 3. Алфавитный перечень слов и понятий с указанием их смысла и всех случаев… … Исторический словарь галлицизмов русского языка

конкорданс — см. словарь Словарь синонимов русского языка. Практический справочник. М.: Русский язык. З. Е. Александрова. 2011. конкорданс сущ., кол во синонимов: 2 • … Словарь синонимов

конкорданс — 1. Алфавитный указатель слов, встречающихся в какой либо книге, с приведением цитат, в которых эти слова встречаются. Термин отмечается в истории перевода и истории лексикографии у некоторых авторов. 2. Словарь, в котором словарные единицы… … Толковый переводоведческий словарь

конкорданс — конкорд анс, а … Русский орфографический словарь

конкорданс — (лат. concordance < concordare согласовывать) 1) словоуказатель с контекстом; 2) словарь контекстов … Словарь лингвистических терминов Т.В. Жеребило

конкорданс — (2 м); мн. конкорда/нсы, Р. конкорда/нсов … Орфографический словарь русского языка

конкорданс — у, ч. Алфавітний перелік усіх слів якого небудь тексту з наведенням контекстів їх використання; тип словника такого виду … Український тлумачний словник

конкорданс — а; м. Спец. Алфавитный перечень всех слов какого л. текста с указанием контекстов их употребления; тип словаря, представленный в таком виде. К. поэтических произведений Лермонтова. К. древнерусского памятника. ◁ Конкордансный, ая, ое. К ая… … Энциклопедический словарь

конкорданс — а; м.; спец. см. тж. конкордансный Алфавитный перечень всех слов какого л. текста с указанием контекстов их употребления; тип словаря, представленный в таком виде. Конкорда/нс поэтических произведений Лермонтова. Конкорда/нс древнерусского… … Словарь многих выражений

конкорданс — іменник чоловічого роду … Орфографічний словник української мови

Читайте также: