Как сделать компонентный анализ

Обновлено: 07.07.2024

Компоне́нтный ана́лиз — в языкознании: метод исследования плана содержания значимых единиц языка, целью которого является разложение значения на минимальные семантические составляющие. Основан на гипотезе о том, что значение всякой языковой единицы состоит из семантических компонентов (сем) и словарный состав языка может быть описан с помощью ограниченного (сравнительно небольшого) числа семантических признаков [1] . В 1950-х годах метод компонентного анализа был впервые использован для исследования лексических единиц при описании узкого круга лексем — терминов родства в различных языках [1] .

Содержание

Компонентный анализ и теория семантического поля

Примечания

↑ 123Кузнецов А. М. Компонентного анализа метод // Лингвистический энциклопедический словарь / Под ред. В. Н. Ярцевой. — М .: Советская энциклопедия, 1990. — ISBN 5-85270-031-2

Литература

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Компонентный анализ" в других словарях:

компонентный анализ — Прием, основанный на том, что единицами анализа являются части (элементы) языковой единицы (номинативно коммуникативной или структурной). Методика компонентного анализа разработана Казанской и Московской лингвистическими школами. Примеры… … Словарь лингвистических терминов Т.В. Жеребило

КОМПОНЕНТНЫЙ АНАЛИЗ — – в палеомагнитологии это выделение компонент Jn в ходе различных чисток: 1) выделение линейных участков на траектории вектора Jn в ходе чистки (не менее 3 точек), соответствующих разрушению одной компоненты; 2) выделение планарных сегментов на… … Палеомагнитология, петромагнитология и геология. Словарь-справочник.

компонентный анализ — komponentinė analizė statusas T sritis Standartizacija ir metrologija apibrėžtis Metodų ir veiksmų, kuriais gaunama informacija apie medžiagų mišinio sandus, visuma. atitikmenys: angl. componential analysis rus. компонентный анализ, m pranc.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

компонентный анализ — komponentinė analizė statusas T sritis chemija apibrėžtis Metodų ir veiksmų visuma, kuriais gaunama informacija apie medžiagų mišinio komponentus. atitikmenys: angl. componental analysis rus. компонентный анализ … Chemijos terminų aiškinamasis žodynas

компонентный анализ — 1. Такой способ анализа текста, который направлен на выделение составных частей значения слова, или семантических компонентов, а так же на выяснение принципов их соединения и структурной организации. 2. Выявление предельных составляющих… … Толковый переводоведческий словарь

Компонентный анализ — см. Метод главных компонент … Физическая Антропология. Иллюстрированный толковый словарь.

компонентный анализ в исследовании текста — Разложение значения слов, используемых в тексте, на минимальные семантические составляющие с целью выявления актуальных значений употребляемых в тексте слов … Словарь лингвистических терминов Т.В. Жеребило

компонентный анализ в исследовании текста — Разложение значения слов, используемых в тексте, на минимальные семантические составляющие с целью выявления актуальных значений употребляемых в тексте слов … Методы исследования и анализа текста. Словарь-справочник

компонентный семантический анализ — Описание лексического значения слова путем установления смысловых компонентов этого значения … Термины и понятия лингвистики: Лексика. Лексикология. Фразеология. Лексикография

компонентный семантический анализ — Описание лексического значения слова путем установления смысловых компонентов этого значения … Словарь лингвистических терминов Т.В. Жеребило

Общее представление о компонентном анализе структурной лингвистики

Компонентный анализ – это исследование значимых единиц языка путём разложения их на мельчайшие, далее не членимые смысловые компоненты.

Компонентный анализ как один из лингвистических методов был основан на том предположении, что значение всякой языковой единицы состоит из семантических компонентов (т.е. сем), а словарный состав языка может быть описан с помощью сравнительно небольшого и при этом ограниченного числа семантических признаков.

Между формальной и смысловой стороной слова существует определённая связь. В одних случаях эта связь может быть симметричной в том смысле, что каждой формальной единице соответствует смысловая единица. В качестве примеров можно рассмотреть такие слова, как:

Готовые работы на аналогичную тему

Впервые метод компонентного анализа был использован в середине ХХ века. Ему нашли применение в исследовании лексических единиц при описании узкого круга лексем – терминов родства в различных языках.

В настоящее время прослеживается чёткая связь метода компонентного анализа и системно-парадигматических представлений о языке. В связи с этим предполагается, что данный метод может быть рассмотрен как развитие теоретической базы и методов теории семантического поля. Это позволило связать метод компонентного анализа со взглядами лингвистов, которые считали возможным перенесение в грамматику и семантику принципов, выработанных в рамках фонологии Н. С. Трубецкого.

передвигаться;
при помощи ног;
в вертикальном положении;
с нормальной скоростью;
в одном направлении.

Компонентный анализ — это метод лингвистического изучения смысла слов. Целью компонентного анализа является расчленение языкового значения на минимальные единицы. Обозначение этих единиц различно: фигура содержания, семантический множитель, дифференциальный признак, ноэма, элементарный смысл, сема и т.д.

В компонентном анализе выделяют три этапа:

выяснение значения слова
установление компонентов в содержании значения слова
построение формул, отражающих структуру значений. Сюда же следует отнести и проверку объективности выделенных компонентов значения.

При компонентном анализе в структуре значения слова выделяют следующие семы:

архисемы, которые отражают признаки, свойственные целым классам объектов
'дифференциальные семы, которые в своей совокупности составляют ядро значения слова, определяя его объем внутри лексико-семантической группы слов и отличая значение данного слова от значений его "соседа". Они отражают непосредственные различия объектов
потенциальные семы, которые отражают различные второстепенные, иногда не обязательные признаки предмета, различные ассоциации, с которыми данный элемент действительности связывается в сознании говорящих

Пример компонентного анализа [ ]

Значения слов мальчик и девочка в результате компонентного анализа приобретают такой вид:

Слова мальчик и мужчина различаются по одному компоненту (детство — зрелость), а мальчик и женщина — по двум (детство - зрелость и мужской пол — женский пол).

Компонентный анализ лексического значения — это последовательность процедур, которая, будучи примененной к словам языка, ставит в соответствие каждому слову определенным образом организованный набор семантических компонентов.

Содержание

К КАЛЗ, т. е. к представлению значений слов в виде комбинации элементарных компонентов смысла, можно придти через установление корреляций между словами. Системными являются те корреляции, которые обеспечивают системность организации множества слов. Это значит, что системные корреляции не должны быть уникальны, они должны характеризовать не одну пару противопоставленных слов, а целый ряд таких пар.

На основе системных отношений между словами строятся пропорциональные равенства, которые можно назвать семантическими пропорциями. Их примеры:

помнить : вспомнить : напомнить = бодрствовать : проснуться : разбудить.

Подобные пропорции выражают тот факт, что, с точки зрения значения, помнить, вспомнить и напомнить — с одной стороны, и бодрствовать, проснуться и разбудить — с другой, имеют нечто общее. Это общее можно приписать совпадению элементов, из которых состоят значения этих слов. (Эта разновидность КА принадлежит Лайонзу и использует для выявления компонентного представления процедуру построения семантических пропорций. Исходным объектом анализа являются вырванные из контекста слова, взятые в их определенном узуальном значении. Компонентное представление значения слова имеет вид произведения семантических компонентов, порядок следования которых никак не оговаривается.)

От констатации сходств и различий между значениями противопоставляемых друг другу слов, от выделения на этой основе общих для них и различительных семантических признаков осуществляется переход к предположению о том, что значение этих слов состоит из элементарных смысловых единиц — семантических компонентов, сем, соответствующих выделенным при сопоставлении признакам. Предположение о том, что значение каждой единицы языка состоит из набора семантических компонентов — это одна из основных гипотез метода КА. Этот метод принадлежит к числу основных методов описания лексического значения.

Из пропорции вспомнить : напомнить = проснуться : разбудить мы можем извлечь три компонента смысла: 'каузировать' (т.е. 'заставить'), 'вспомнить' и 'проснуться'. На этой стадии анализа 'вспомнить' и 'проснуться' выступают как единые компоненты. Если далее мы привлечем к рассмотрению пропорцию помнить :вспомнить = бодрствовать : проснуться, мы сможем извлечь новые компоненты — 'начать', 'помнить' и 'бодрствовать'. Ни один из этих компонентов априори не считается минимальным элементом смысла или семантическим примитивом, так как вполне вероятно, что, привлекая другие слова языка для сравнения с данными и составляя пропорции, м.будет разложить эти компоненты на > простые.

Для обозначения минимальной единицы значения используется целый ряд терминов: сема, семантический дифференциальный признак, семантический множитель, семантический примитив, смысловой атом и т. п.

К настоящему моменту метод КА имеет уже более чем 30-летнюю традицию. Начиная с 60-х гг. его применяют в лексической семантике с различными целями, основной из которых является описание лексических значений.

Метод КА реально существует во множестве вариантов, которые могут существенно отличаться друг от друга по целому ряду параметров. Однако его суть остается неизменной.

Существует вариант КА, основанный на применении процедуры вертикально-горизонтального анализа значений. Она предусматривает сопоставление значений слов в двух измерениях:

— в вертикальном, когда сравниваются значения, стоящие на разных уровнях иерархии родо-видовых отношений, т. е. значения гиперонимов со значениями гипонимов;
— в горизонтальном, когда сравниваются значения одного и того же уровня иерархии.

На примере слова magazine 'журнал':

Этап 1: определить ту единицу смысла, которая включает значение слова magazine, т.е. найти ближайший гипероним для этого слова. Это будет значение слова periodical 'периодическое издание'.

Этап 2: найти те единицы, которые могут считаться включенными в значение слова, т. е. его гипонимы (slics, pulps, comics или названия конкретных журналов).

Этап 3: исследование единиц того же самого иерархического уровня, которые находятся с интересующим нас значением в отношении несовместимост, антонимии и т.д.. ( book 'книга', newspaper 'газета')'. Значение magazine противопоставляется значению book по признаку периодичности. Magazine противопоставлен newspaper как издание переплетенное.

Этап 4: составление списка тех минимальных компонентов, которые отличают значение слова magazine от других значений того же уровня, позволяют включить его в рамки ближайшего вышестоящего значения и охватывают значения его гипонимов. В нашем случае это будут три компонента: 'периодическое издание', 'переплетенное' и 'носящее довольно популярный характер'.

Этап 5: заключительный, состоит в формулировании дефиниции слова на основе его диагностических компонентов.

Этот вариант КА является типичным для определенной стадии развития данного метода. Он вырабатывался на материале конкретной лексики и в этой области дает приемлемые результаты. Но как только мы обратимся к анализу слов, обозначающих не предметы, а их свойства и отношения между ними, этот вариант КА окажется неудовлетворительным.

Например, к слову beautiful 'прекрасный, красивый' процедура вертикально-гор.анализа не применима и нужны другие процедуры, названные процедурами анализа пересекающихся значений, суть которых состоит в обращении к рассмотрению не слова самого по себе, а словосочетаний с данным словом.

На примере слова beautiful:

Этап 1: найти слова, близкие к данному по значению, т. е. слова из того же семантического поля, которые могут использоваться применительно к тем же объектам или событиям: beautiful 'красивый', pretty 'привлекательный', lovely 'очароват.' и т. п.

Этап 2: выявление круга объектов, которые могут описываться с помощью отобранных слов. При этом эффективный метод состоит не в том, чтобы перечислять сотни приемлемых словосочетаний с данными словами, а в том, чтобы найти такие контексты, в которых та или иная единица либо неприемлема совсем, либо выглядит необычно, странно. Это называется анализом отрицательного языкового материала.

Handsome: man, woman, *lake

Lovely: dress, room, old lady

Pretty: jewel, *skyscraper

Этап 3: выявить те аспекты близких значений, на которых основано их противопоставление. Наиболее эффективный прием — постановка квазисинонимов в один и тот же контекст. Так, сравнивая beautiful woman 'красивая женщина' с pretty woman 'хорошенькая женщина', мы обнаруживаем, что beautiful выражает большую степень интенсивности качества.

Этап 4: перечисление существенных признаков слова, по которым оно противопоставлено своим квазисинонимам:

1) привлекательность; 2) общего вида; 3) в достаточно высокой степени.

Видим, что для выявления семантической структуры абстрактной лексики мы обращаемся к анализу слова в контексте и используем нашу способность оценить языковые выражения как правильные или неправильные и как означающие одно и то же или неравнозначные.

Этот вариант КА и не ставил своей целью дать такое описание значения слова, чтобы на его основе можно было построить описание значения единицы более высокого уровня, т. е. предложения. Однако при анализе абстрактной лексики необходимо скорректировать традиционные методы КА. Показать необходимость такого пересмотра удобно на основе анализа значения слова только, осуществленного И. А. Мельчуком. Это слово рассмотрим в том его узуальном значении, которое оно имеет в контекстах типа (1)-(3):

1) Я купил только чашки. 2) Пришло только три студента. 3) Собака только обнюхала его.

Здесь нам не удастся ни указать гипероним, ни очертить круг слов, с которыми нужно сопоставлять это слово, ни построить семантические пропорции. Здесь мы должны описывать не значение отдельно взятого слова только, а значение определенного класса предложений с этим словом. Надо описать значение всей фразы целиком и посмотреть, какая часть этого описания будет связана с присутствием во фразе слова только. Описание значения предложения — это его перифраза на том же самом языке или перевод на специально созданный семантический метаязык, который в более явном виде представляет значение описываемого предложения. Толкованием фразы (1) будет фраза (1а):

(1а) Я купил чашки и неверно, что я купил что-либо, кроме чашек. Аналогичные толкования имеют фразы (2) и (3):

(2а) Пришло три студента и неверно, что пришло сколько-либо студентов,кроме трех. (За) Собака обнюхала его и неверно, что собака сделала с ним что-либо,кроме обнюхивания.

На счет только должны быть отнесены правые (после и) части фраз (1)-(3). Теперь нам надо выявить то общее, что имеют междусобой эти правые части, и мы получим описание значения слова только.

Вывод: многие слова могут быть описаны семантически только в составе выражений, больших по объему, т.е. словосочетаний или предложений. Этот вывод впервые был четко сформулирован представителями Московской семантической школы в начале 60-х гг.

Итак, в противовес классическому компонентному анализу, работавшему с отдельным словом, современные варианты КА исходят из того, что в общем случае толкуемой единицей должно быть не отдельно взятое слово Р, а содержащее его выражение вида ХРУ,где X и Y — переменные, сообщающие данному выражению форму предложения или словосочетания. Такое выражение называется сентенционной формой (от sentence — предложение). Описание значения слов в составе сентенционных форм образует тот необходимый мостик, по которому мы из области лексической семантики переходим в область семантики предложения.

Еще вывод: значение слова должно представляться в виде структуры,, состоящей из элементов смысла и связывающих их синтаксических отношений. С формальной точки зрения, это может быть и предложение семантического языка с однозначной синтаксической структурой, и формула исчисления предикатов, и граф,вершинами которого являются смысловые атомы. Тем самым метаязык КА должен иметь не только словарь элементарных семантических единиц, но и свой достаточно развитый синтаксис.

Компонентный анализ (components analysis) – многомерный статистический метод снижения размерности, применяемый для изучения взаимосвязей между значениями количественных переменных. Задача компонентного анализа состоит в преобразовании исходной системы взаимосвязанных переменных в новую систему некоррелированных обобщенных показателей или ортогональных показателей. Новые некоррелированные показатели называются компонентами.

Алгоритм компонентного анализа состоит в последовательном извлечении компонент. Для единственности решения в методе главных компонент компоненты должны быть упорядочены по убыванию доли объясняемой суммарной дисперсии исходных переменных. Первая компонента характеризует наибольшую долю вариации исходных переменных, вторая компонента объясняет наибольшую долю дисперсии, не объясняемой первой компонентой и т.д. В результате компонентного анализа число полученных некоррелированных компонент совпадает с числом исходных переменных. Т.е. классический компонентный анализ сохраняет размерность пространства переменных.

Каждой извлеченной компоненте соответствует характеристика, называемая собственным значением. Собственное значение показывает часть вариации исходных переменных, объясняемую компонентой. В компонентном анализе, если используется корреляционная матрица, каждая переменная стандартизирована и ее дисперсия равна 1. Следовательно, если число исходных переменных k, то суммарная дисперсия равна k. Компонентный анализ сохраняет всю суммарную дисперсию, поэтому сумма всех собственных значений равна числу исходных переменных.

На основе полученных собственных значений рассчитывается матрица нагрузок и дается интерпретация компонент. На основе полученной матрицы нагрузок в компонентном анализе может быть произведено вращение факторов для получения простой структуры матрицы нагрузок. Классический компонентный анализ, в отличие от факторного анализа, не предполагает вращение матрицы нагрузок. Но вращение настолько полезная возможность методов снижения размерности, что алгоритмы вращения были разработаны для компонентного анализа.

На основе окончательной матрицы нагрузок рассчитывают индивидуальные значения главных компонент для каждого объекта наблюдения. Индивидуальные значения главных компонент на объектах представляют собой линейную комбинацию исходных переменных для каждого фактора. На практике для интерпретации и дальнейшего анализа используют компоненты, удовлетворяющие следующим условиям:

их собственные значения должны быть больше 1 – это означает, что компонента более информативна, чем стандартизированная переменная;
компонента должна иметь хотя бы одну нагрузку больше критического значения – это означает, что компонента тесно связана, по крайней мере, с одной исходной переменной.

Отобранные для дальнейшего анализа компоненты называют главными компонентами. Отсюда название метода – метод главных компонент. Индивидуальные значения главных компонент могут быть использованы для дальнейшего статистического анализа, например:

построения уравнения регрессия на главные компоненты;
кластеризации наблюдений по главным компонентам.

Факторный и компонентный анализы – оба метода снижения размерности. Оба метода решают в принципе одну и ту же задачу и поэтому результаты похожи. В матрицах нагрузок первый общий фактор и первая главная компонента, как правило, совпадают. Второй фактор может уже существенно отличаться от второй главной компоненты и т.д. Иногда даже число общих факторов может существенно отличаться от числа весомых главных компонент.

Предпосылки методов факторного и компонентного анализа различаются. Цель компонентного анализа – объяснить всю корреляцию между переменными и всю суммарную дисперсию исходных переменных. Число первоначально извлеченных компонент совпадает с числом исходных переменных. Хотя в дальнейшем анализе используются только главные компоненты.

В факторный анализ с самого начала предполагает, что число извлеченных факторов будет существенно меньше числа первоначальных переменных. В факторном анализе извлеченные новые переменные-факторы в принципе не могут объяснить полностью суммарную дисперсию исходных переменных и их корреляции.

Компонентный анализ используют чаще как метод избавления от мультиколлинеарности объясняющих переменных в регрессионном анализе. Главные компоненты всегда не коррелированы между собой. Общие факторы могут быть коррелированными или слабо коррелированными между собой.

В факторном анализе делается больший акцент на интерпретации факторов. В компонентом анализе делается больший акцент на сокращение размерности пространства за счет некоррелированных переменных.

Читайте также: