Стоп лист что это: Что такое стоп лист в банке и как из него выйти

Стоп лист что это: Что такое стоп лист в банке и как из него выйти

Содержание

Инструкции

Вывод банковской карты из стоп-листа


Это статья для тех, кто прикладывал к терминалу банковскую карту.

Если Вы прикладывали телефон, прочтите эту статью.



Когда банку не удаётся списать деньги за поездку, карта заносится в стоп-лист транспортной системы.

Чтобы вывести её из стоп-листа, нужно погасить задолженность. Карта будет выведена из стоп-листа в течение суток после погашения долга.

Самостоятельное погашение задолженности

Вы можете самостоятельно погасить задолженность через личный кабинет пассажира на транспортно-карточной платформе.

Шаг 1

Перейдите на страницу входа в личный кабинет пассажира. Введите полный номер банковской карты и код с картинки и нажмите «Войти».

Вход в личный кабинет пассажира на транспортно-карточной платформе

Шаг 2.

Если на карте есть задолженность, на странице истории оплаты проезда Вы увидите кнопку «Погасить задолженность» и сумму долга. Неоплаченная поездка будет иметь статус «Запрещена».

Страница истории оплаты проезда банковской картой

Чтобы оплатить поездки, нажмите «Погасить задолженность». Банк автоматически произведёт списание средств.
Мобильный банк пришлёт сообщение о покупке в DATA.KGILC.RU LKP.
На странице истории оплаты появится строка об успешном ручном погашении, а статус неоплаченной поездки изменится на «Поездка оплачена».

Автоматическое погашение задолженности

Для банковских карт и nfc-устройств также работает автоматический вывод из стоп-листа — банк будет обращаться к карте для оплаты по расписанию в течение месяца.
Вам необходимо обеспечить наличие денег на балансе карты и подождать повторного обращения банка к карте. После первого отказа банк обращается к карте через сутки, затем 3 дня, 10 дней и через 14 дней.
Через 28 дней после первого отказа разблокировать банковскую карту или nfc-устройство можно только через личный кабинет пассажира.

Карта Сбербанка в стоп листе в транспорте

Практически во всех маршрутках, автобусах и троллейбусах на территории РФ установлены терминалы безналичной оплаты. У этой системы есть один достаточно серьезный минус – из-за сбоев, ошибок или просто недостатка средств на карте платежное средство может попадать в стоп-лист. Что это такое и как с этим бороться – читайте в этой статье.

Содержание

Скрыть

  1. Причины ошибки платежа
    1. Что такое стоп лист
      1. Как снять задолженность
        1. Личный кабинет пассажира
      2. Часто задаваемые вопросы
        1. Какими картами можно оплачивать проезд в автобусе
        2. Если при оплате картой, средства не списались

      Причины ошибки платежа

      Существует несколько основных ошибок платежа, которые могут привести к различным проблемам:

      Проблема

      Описание

      Карта в Стоп-листе

      Предыдущая поездка не была оплачена.

      Недостаточно средств

      На карте на данный момент нет денег.

      Платеж не принят

      Слишком мало держали карту возле терминала.

      Устройство не работает

      Обычно оно просто не светится, потому можно даже не пытаться платить безналичным образом. В некоторых случая из-за длительного бездействия терминал «тухнет». Достаточно нажать на любую кнопку и можно спокойно платить.

      Сбой в работе

      Рекомендуется повторить операцию.

      Что такое стоп лист

      Если появляется сообщение о том, что карта Сбербанка в стоп листе – это значит, что платежное средство ранее использовалось для оплаты проезда, но по какой-то причине с пластика не была списана сумма за проезд. Основная причина – недостаток средств на карте, но иногда это может быть и сбой системы. В любом случае, на карте сформировалась задолженность, которую нужно погасить. В противном случае пользоваться системой безналичной оплаты поездки не получится.

      Как снять задолженность

      Снять задолженность по карте очень просто:

      1. Перейти на сайт с личным кабинетом пассажира.
      2. В левом верхнем углу найти кнопку входа в личный кабинет и нажать на нее. 
      3. Ввести номер карты и проверочный код. 
      4. Откроется личный кабинет, в котором на самом видном месте будет располагаться информация о неоплаченной поездке. Достаточно оплатить ее вручную (спишется соответствующая сумма). После этого картой можно пользоваться для оплаты проезда без проблем.

      Личный кабинет пассажира

      Личный кабинет пассажира – это универсальная платформа, которая предназначена преимущественно для отслеживания своих поездок, а также проверки задолженности перед транспортными компаниями. Авторизация в системе элементарная, предварительная регистрация не требуется. Также тут практически нет никакого функционала, кроме истории поездок и возможность погасить задолженность.

      Часто задаваемые вопросы

      Какими картами можно оплачивать проезд в автобусе

      Расплачиваться в транспорте можно абсолютно любыми картами Visa и MasterCard, без ограничений.

      Если при оплате картой, средства не списались

      Если автобус уже привез пассажира туда, куда требовалось, а средства не списались, возможно произошел сбой в системе или на карте нет денег. Рекомендуется заплатить наличным образом или, если проезд все же был оплачен, но с карты все равно ничего не списало – зайти в личный кабинет пассажира и погасить долг так, как это описано выше.

      Бесконтактная банковская карта БАРНАУЛ :: Официальный сайт города

      Порядок приема и рассмотрения обращений

      Все обращения поступают в отдел по работе с обращениями граждан организационно-контрольного комитета администрации города Барнаула и рассматриваются в соответствии с Федеральным Законом от 2 мая 2006 года № 59-ФЗ «О порядке рассмотрения обращений граждан Российской Федерации», законом Алтайского края от 29.12.2006 № 152-ЗС «О рассмотрении обращений граждан Российской Федерации на территории Алтайского края», постановлением администрации города Барнаула от 21.08.2013 № 2875 «Об утверждении Порядка ведения делопроизводства по обращениям граждан, объединений граждан, в том числе юридических лиц, организации их рассмотрения в администрации города, органах администрации города, иных органах местного самоуправления, муниципальных учреждениях, предприятиях».

      Прием письменных обращений граждан, объединений граждан, в том числе юридических лиц принимаются по адресу: 656043, г.Барнаул, ул.Гоголя, 48, каб.114.

      График приема документов: понедельник –четверг с 08.00 до 17.00пятница с 08.00 до 16.00, перерыв с 11.30 до 12.18. При приеме документов проводится проверка пунктов, предусмотренных ст.7 Федерального закона от 02.05.2006 № 59-ФЗ «О порядке рассмотрения обращений граждан Российской Федерации»:

      1. Гражданин в своем письменном обращении в обязательном порядке указывает либо наименование государственного органа или органа местного самоуправления, в которые направляет письменное обращение, либо фамилию, имя, отчество соответствующего должностного лица, либо должность соответствующего лица, а также свои фамилию, имя, отчество (последнее — при наличии), почтовый адрес, по которому должны быть направлены ответ, уведомление о переадресации обращения, излагает суть предложения, заявления или жалобы, ставит личную подпись и дату.

      2.  В случае необходимости в подтверждение своих доводов гражданин прилагает к письменному обращению документы и материалы либо их копии.

      3.  Обращение, поступившее в государственный орган, орган местного самоуправления или должностному лицу в форме электронного документа, подлежит рассмотрению в порядке, установленном настоящим Федеральным законом.

      В обращении гражданин в обязательном порядке указывает свои фамилию, имя, отчество (последнее — при наличии), адрес электронной почты. Гражданин вправе приложить к такому обращению необходимые документы.

      В соответствии со статьей 12 Федерального закона от 2 мая 2006 года № 59-ФЗ письменное обращение, поступившее в государственный орган, орган местного самоуправления или должностному лицу рассматривается в течение 30 дней со дня его регистрации.

      Ответ на электронное обращение направляется в форме электронного документа по адресу электронной почты, указанному в обращении, или в письменной форме по почтовому адресу, указанному в обращении.

      Итоги работы с обращениями граждан в администрации города Барнаула размещены на интернет-странице организационно-контрольного комитета.

      как вывести банковскую карту из стоп-листа

      07.02.2021 18:00

      49260

      24

      Череповецкие транспортники разработали инструкцию по выводу карты из стоп-листа.

      По каким причинам карта попадает в стоп-лист

      • Не хватило денег для оплаты проезда.
      • Произошла ошибка процессинга.

      Как вывести из стоп-листа «пластик»

      «В большинстве случаев карта попадает в стоп-лист, если на ней недостаточно денег для оплаты проезда. Все терминалы работают в режиме офлайн, поэтому при прикладывании карты или гаджета билет выходит в любом случае. Пассажир может быть не в курсе, что деньги не списались, это становится известно только во время следующей поездки. Если терминал выдает информацию, что карта в стоп-листе, это не значит, что сейчас на ней нет денег, это значит, что не была оплачена предыдущая поездка. В этом случае можно оплатить проезд другой картой или наличными. Иногда может сразу прийти оповещение о списании средств, а затем сообщение об оплате проезда. В этом случае оплачивается текущая поездка, а деньги списываются за предыдущую», — объясняет менеджер «Электротранса» Светлана Киселёва.

      Чтобы вывести карту из стоп-листа, нужно пополнить баланс и погасить долг. Сделать это можно через личный кабинет на сайте банка.

      Карта будет выведена из стоп-листа в течение суток.

      Как вывести из стоп-листа виртуальную карту

      Речь идет о картах, внесенных в приложения Samsung Pay, Goodle Pay или Apple Pay. В этом случае для вывода карты из стоп-листа нужен номер виртуального счета. Он указан в приложении смартфона.

      На электронную почту [email protected] нужно направить письмо с темой «карта в стоп-листе». В письме указать свое имя, номер телефона, последние четыре цифры виртуального счета, платежную систему (Visa, MasterCard, Мир), дату последней успешно оплаченной поездки.

      Ошибки процессинга встречаются крайне редко. Такую ошибку исправит только специалист. Обращаться по телефону 8−8202−54−60−75.

      Подробнее о выводе карт из стоп-листа — на сайте «Электротранса».

      Семен Мануйлов

      Вы в стоп-листе: за что карты ярославцев блокируют в общественном транспорте | 12.03.21



      Посетив его, представители бизнеса могут получить целый комплекс ИТ-услуг, а также протестировать их прямо на месте.

      В Ярославле начал работу новый офис продаж и обслуживания «Ростелекома» для корпоративных клиентов. Торжественное открытие, а также демонстрация всех
      возможностей, которые теперь смогут получать представители бизнес-сообщества, состоялись 29 октября. В современном и удобном офисе посетители могут
      воспользоваться консультацией специалистов и подключить цифровые сервисы. В просторных помещениях развернут бесплатный Wi-Fi, установлены умные экраны, на которых транслируется полезная информация об услугах провайдера. В салоне оборудована зона Welcome с удобными креслами и мягким диваном, где можно решить любые оперативные задачи, а также отдохнуть.

      Как отметил вице-президент ПАО «Ростелеком» – директор макрорегионального филиала «Центр» Денис Лысов, пандемия диктует свои условия при взаимодействии компании с клиентами: оно все больше переходит на цифровые площадки. Однако прямой контакт и живое общение заменить все-таки невозможно ничем. Именно в этом основная цель открытия нового офиса.

      — Это удобная и комфортная площадка для общения, на которой можно собрать все наши продукты и услуги. Всё новое, что будет появляться у компании, можно будет здесь попробовать, пощупать, проверить. И мы хотели бы, чтобы каждый, входящий в это здание, получал только позитивные эмоции. Надеюсь, что постепенно пандемия будет уходить и офис наполнится новой энергией, — сказал Денис Лысов.

      На территории Ярославской области это первый офис для корпоративных клиентов, два подобных уже действуют в соседнем Костромском регионе.

      — Новый для региона формат офиса продиктован требованием времени: нашим пользователям гораздо легче принять решение о подключении высокотехнологичных

      услуг после их тестирования. И мы предоставляем им такую возможность. Офис максимально удобен для посетителей, и рассчитываем, что он станет местом ИТ-


      поддержки предпринимательства, — говорит Роман Русских, директор филиала ПАО «Ростелеком» в Ярославской и Костромской областях.

      Итак, что же получат в новом офисе корпоративные клиенты, которых в нашем регионе у «Ростелекома» более 20 тысяч? Офис имеет пять рабочих зон — ресепшен, пространство для обслуживания среднего и малого бизнеса, зону VIP-обслуживания, две переговорные комнаты и демонстрационную зону, где компания презентует свои цифровые сервисы. Он оснащён умной системой видеонаблюдения, виртуальной телефонной станцией, управляемым Wi-Fi и умными экранами от компании «Ростелеком».

      — Виртуальная АТС позволяет контролировать доступность наших сотрудников. С помощью системы голосового меню можно настроить автоматическое распределение звонков по тематике, а система записи диалогов с клиентами позволяет контролировать качество соблюдения нашими сотрудниками стандарта обслуживания. Также это очень хорошо помогает для разрешения конфликтных ситуаций. Умная система видеонаблюдения позволяет учитывать количество посетителей в офисе за день, неделю, месяц, контролировать присутствие сотрудников на рабочих местах, а также наблюдать за предметами, которые оставлены в периметре офиса, — рассказал заместитель директора филиала ПАО «Ростелеком» — директор по работе с корпоративным сегментом Денис

      Кобзарь.

      В демозоне он наглядно продемонстрировал те продукты, которыми могут воспользоваться корпоративные клиенты — «Телевидение для бизнеса», «Умные экраны»

      «Видеонаблюдение» «Wi-Fi для гостей». Например, умный экран позволяет руководителю бизнес-проекта оценить эффект от проводимой рекламной кампании, не отходя от своего компьютера. Заказчик в личном кабинете сам настраивает критерии, по которым можно

      собрать ту ли иную аудиторию.

      — Предположим, вы являетесь управляющими сети ресторанов либо автозаправочных станций. У вас есть необходимость разместить контент либо провести рекламную акцию во всех точках присутствия ваших офисов. При этом нужно посчитать отклик потенциальной аудитории на эту кампанию. Так вот сервис «Умные экраны» помогает это сделать, — показывает возможности услуги Роман Кобзарь.

      Телевидение от «Ростелекома», установленное в кафе или иных точках обслуживания, позволяет избежать проблем с авторскими правами.

      — С одной стороны, это обычное телевидение, которое мы привыкли смотреть дома, лёжа на диване, но на самом деле тут есть особенности. Контент, который здесь транслируется, разрешён для публичного показа. Каналы можно сортировать по пакетам. Есть три пакета — развлекательные каналы, пакет для гостиниц и пакет, допустим, для сети ресторанов. Вы можете на экран телевизора выводить контекстную рекламу, размещать свой видеоролик поверх рекламы, которая идёт на ТВ,— показывает возможности телевидения Денис Кобзарь.

      Доступна для корпоративных клиентов «Ростелекома» и система умного видеонаблюдения. В личном кабинете руководитель может настроить контроль

      соблюдения масочного режима, мониторинг посетителей и сотрудников — все это в динамике. Лица тех сотрудников, которые в маске, умная система обводит зелеными квадратиками, тех, кто игнорирует правила — красными. Всего компания предлагает бизнес-клиентам более 50 различных телеком-услуг.

      — Открытие офиса для регионального бизнеса — это важное событие. Обычно и хорошо, что, компании заботятся о комфорте тех граждан, которые приходят к ним в офис. А бизнес-клиенты, кажется, делать этого не должны и поэтому они оценивают сервис предлагаемых услуг, как правило, дистанционно. «Ростелеком» решил, что и бизнес должен получать услуги так же комфортабельно, как любой клиент, который, придя в офис, может протестировать качество услуг — подчеркнул Алексей Филиппов, директор департамента информатизации Ярославской области.

      Он отметил, что у обычного человека «Ростелеком» наверняка вызывает ассоциацию с привычным для всех проводным интернетом. Но на самом деле на этой компании лежит исполнение крупных инфраструктурных и важных для каждого из ярославцев проектов, таких как видеонаблюдении на выборах и ЕГЭ, электронное голосование, портал государственных услуг. За всей этой работой стоят ответственные и увлеченным своим делом сотрудники.

      Поэтому в праздничный день открытия офиса лидеры компании получили почетные грамоты департамента информатизации и связи Ярославской области. Офис по работе с корпоративными клиентами «Ростелекома» на ул. Лисицына, дом 8 открыт для посетителей с понедельника по четверг с 9 до 18–00, в пятницу — с 9 до 17.00.

      ЛИСТ — это… Что такое СТОП-ЛИСТ?

    2. стоп-лист — сущ., кол во синонимов: 1 • стоп список (1) Словарь синонимов ASIS. В.Н. Тришин. 2013 …   Словарь синонимов

    3. Стоп-Лист — банковский реестр с номерами блокированных пластиковых карточек. Словарь бизнес терминов. Академик.ру. 2001 …   Словарь бизнес-терминов

    4. стоп-лист — сущ. ограничительный список (список запрещённых книг, людей, лишённых каких либо прав, запретных слов и т.п.) …   Универсальный дополнительный практический толковый словарь И. Мостицкого

    5. СТОП-ЛИСТ — 1. специальный банковский реестр с номерами блокированных пластиковых валютных карточек; назначение – защита от мошенников, специализирующихся на надувательстве банкоматов 2. публикация наименований и номеров похищенных и пропавших акций …   Большой экономический словарь

    6. СТОП-ЛИСТ — (англ. stop list) – список запрещенных к приему номеров платежных карт, распространяемый эквайрером по обслуживаемым им точкам приема. В зависимости от правил, принятых в платежной системе или установл. эквайрером (см. Эквайринг), постановка… …   Финансово-кредитный энциклопедический словарь

    7. Стоп-лист — документ, содержащий информацию об отелях или турах, продажа которых на указанные даты закончена, предназначен для туристических агентств …   Лексикон туриста

    8. стоп-список — сущ., кол во синонимов: 1 • стоп лист (1) Словарь синонимов ASIS. В.Н. Тришин. 2013 …   Словарь синонимов

    9. Стоп! Думаю себе — «Стоп! Думаю себе» Песня Игоря Талькова из альбома «Этот мир» (1993) Выпущен 1993 Записан 1988 Жанр Авторская песня Композитор …   Википедия

    10. Банковский чек — (Bank check) Определение банковского чека, виды чеков, содержание чека Информация об определении банковского чека, виды чеков, содержание чека Содержание Содержание Определение Виды и Понятие и юридическая природа чека Содержание чека Отношения… …   Энциклопедия инвестора

    11. Профессионалы.ру — Стиль этой статьи неэнциклопедичен или нарушает нормы русского языка. Статью следует исправить согласно стилистическим правилам Википедии …   Википедия

    12. Стоп-лист. Механизм решения негативных ситуаций в ресторане

      Как автоматизация ресторана решает проблемы со стоп-листом?


      Каждый посетитель ресторана рано или поздно сталкивался с не слишком приятной ситуацией, когда в ответ на желание заказать тщательно выбранное блюдо официант (некоторое время спустя) возвращался с «новостью»: извините, мол, это блюдо мы приготовить не сможем. Разочарование, потерянное время, а в некоторых случаях и чувство неудобства (если вы, к примеру, пришли в ресторан с девушкой, расписав ей обо всех достоинствах именного этого заведения). Даже самые искренние извинения обслуживающего персонала в этой ситуации не помогут. Подобная проблема «произрастает» еще из прошлых времен с обслуживанием, оставлявшим желать лучшего. Но сейчас, когда технологии стали важной частью нашей жизни, а возможности автоматизации делают работу сотрудников ресторана качественнее и оперативнее? Рассмотрим возможности системы, установленной в заведении общепита.


      Итак, стоп-лист – это список блюд из меню ресторана, которые не могут быть приготовлены в конкретный день. Одна из самых распространенных причин – отсутствие необходимых ингредиентов (например, свежая рыба была, но к вечеру закончилась, так как рыбные блюда в часы обеда пользовались повышенным спросом). Понятно, что этот список может меняться день ото дня.

      Стоп-лист – инструмент для анализа


      Проанализировав стоп-лист ресторана, можно оценить его работу (и в особенности работу кухни). Понятно, что у лучших заведений такой список короткий или вообще отсутствует. Тогда как длинный список блюд, недоступных для гостей, говорит о нерасторопности или о недостаточно отлаженной схеме снабжения ресторана.

      Как избежать неприятных ситуаций, связанных со «стопом»?


      Первый вариант – «по старинке». Необходимо вовремя информировать всех сотрудников ресторана о том, что блюдо закончилось (или заканчивается). Для этого можно, например, наклеивать бумажки с записками на доску объявлений на кухне или у рабочего места официанта. Разумеется, подобные «послания», написанные наспех, не добавляют очков имиджу заведения. К тому же, они могут теряться; да и не всегда сотрудник успевает оперативно записать вышедшее из меню блюдо (или, наоборот, блюдо, вернувшееся в меню). А теперь представьте час пик ресторана… Легко вообразить, какой хаос может возникнуть с этими записками!


      Кроме того, такое решение не дает возможность собирать аналитические данные по стоп-позициям, а значит, не позволяет заведению развиваться и улучшать работу.

      Что же делать?!..


      Если ресторан оснащен современной системой автоматизации, подобной ситуации легко можно избежать. Так, например, в линейке программных продуктов «Трактиръ: FrontOffice v.3» (разработка ГК «СофтБаланс») автоматизирован механизм «Стоп-лист», который дает возможности гибкого инструмента управления: http://www.sb-traktir.ru/production/front_office/


      Рассмотрим его возможности подробнее. С помощью специально разработанного механизма решаются следующие задачи:

      • оперативное пополнение/удаление данных о наличии или отсутствии в меню конкретных позиций,
      • вывод сообщений об изменения данных на все терминалы системы,
      • отправка сообщений на пейджеры официантов,
      • возможность занесения остатков блюда или продукта и отображение уменьшения его количества по мере реализации (со своевременным извещением сотрудников заведения).


      Механизм прост и надежен, может быть доступен с любой рабочей станции (права на пользование инструментом стоп-лист прописываются в системе отдельно).


      Официанты всегда могут оперативно просматривать данные стоп-листа. С другой стороны, они ограждены от ошибочного внесения в стоп-лист блюд (права на добавление позиций в этот список у них нет). Это позволяет избежать неприятных ситуаций, которые могут вызвать раздражение гостей.


      Сомелье, чья профессия так важна для имиджа ресторана, также оценили удобство этого механизма, предоставляющего самую оперативную и достоверную информацию о запасах дорогостоящего алкоголя. Использование системы стоп-лист позволяет избежать возможных неловкостей при общении с гостями (например, если гость хочет сделать заказ дорогого вина, которое буквально вчера закончилось в ресторане). В нашем случае сомелье всегда знает, какой напиток из актуального ассортимента заведения можно предложить конкретному посетителю, чтобы он остался доволен.


      Руководители управляющие ресторана с помощью этого механизма получают отчет, отображающий блюда, которые находились в стоп-листе, а также данные о том, как долго они там числились. Все это позволяет проанализировать ситуацию и принять своевременные управленческие решения.


      Рассказывает Андрей Кудюмов, руководитель направления HoReCa, ГК «СофтБаланс»: «Инструмент «Стоп-лист» в «Трактире» оказался незаменимым также для администраторов и менеджеров ресторанов. Ведь именно им приходится разрешать все напряженные ситуации с гостями и доводить до сведения персонала информацию о блюдах, которых временно нет в продаже. В частности, сети ресторанов парка развлечений «Диво Остров», сети пивных ресторанов BeerHaus и пицца-баров Street уже вооружены этим простым и надежным механизмом».

      Вместо резюме


      Технологии сделали работу сотрудников ресторана оперативной и эффективной, а знание возможностей системы автоматизации является важным преимуществом заведения. Поэтому руководителям следует уделять внимание не только покупке и установке программных продуктов, но и обучению персонала работе с ними. И тогда такие его возможности, как, например, стоп-лист в третьей версии линейки программных продуктов «Трактиръ», станут бесценным помощником как для официантов, так и для других сотрудников ресторана.

      Вам будут интересны другие статьи на эту тему: 

      В ресторан ходят, прежде всего, есть и процент аудитории, которая не считает еду краеугольным камнем в выборе заведения, весьма незначителен. 

      Что Вы собираетесь предлагать гостям? Каков бы ни был ваш ответ, совет один: пересмотрите свои ресурсы, взвесьте все «за» и «против».

      Чтобы меню стало отлаженным инструментом продаж, оно должно, в первую очередь, быть грамотно составлено. 

      Редко кто, играя свадьбу, думает, что супруги наскучат друг другу. Другое дело — ресторанные предложения.

      Успешный ресторатор должен обладать здоровой долей цинизма, чтобы с одной стороны самому верить в то гастрономическое чудо, которое создает ресторан для клиента, а с другой – помнить о том, из чего это чудо делается и какие затраты это за собой влечет…

      стоп-листов | MAXQDA

      Стоп-списки — это наборы часто используемых слов, таких как определенные и неопределенные артикли, союзы или числительные. Такие слова обычно являются избыточными элементами при анализе текста, поскольку не несут особого смысла. По этой причине рекомендуется исключить их из анализа. MAXDictio позволяет создавать сколько угодно списков остановок, а также редактировать их и управлять ими.

      Окно стоп-списка

      Для управления стоп-списком откройте MAXDictio> Stop list .

      Появится следующее окно:

      Окно разделено на три части:

      1. Стоп-списки для проектов

      В этом разделе перечислены все стоп-листы, хранящиеся в файле проекта. Если вы откроете файл проекта на другом компьютере в MAXQDA или отправите его другому человеку в группе по электронной почте, списки, отображаемые в этом разделе, будут доступны.

      «Стоп-список для облака тегов» всегда отображается как первая запись. Он содержит все стоп-слова, используемые для создания облака слов в MAXQDA, и его можно редактировать так же, как и любой другой стоп-лист.Его нельзя удалить. Под «Стоп-списком для облака тегов» всегда доступен как минимум еще один стоп-лист, который также нельзя удалить.

      2. Глобальные стоп-листы

      В этом разделе содержатся все стоп-листы, которые хранятся не в файле проекта, а в самой установке MAXQDA. Эти стоп-листы доступны для каждого проекта, открытого с помощью этой установки MAXQDA.

      Если вы открываете проект MAXQDA на другом компьютере, глобальные списки могут быть недоступны.

      3.Исключенные слова

      В этом списке отображаются все условия поиска, включенные в стоп-список. Список всегда отсортирован в алфавитном порядке для удобства пользователя.

      Активировать стоп-листы

      Щелкните имя стоп-списка, чтобы сделать его активным. Стоп-слова из выбранного списка будут отображаться в разделе «Исключенные слова». MAXDictio всегда использует именно эти стоп-слова, которые перечислены на правой панели. Выбранный стоп-лист всегда обозначается синим или серым фоном.

      Подсказка: Если вы выбрали глобальный стоп-список и открыли проект на компьютере, на котором этот глобальный стоп-список недоступен или был удален, MAXDictio автоматически использует следующий стоп-лист в списке.

      Создать новый стоп-лист

      По умолчанию каждый проект MAXQDA имеет как минимум два стоп-листа. «Стоп-список для облака тегов» используется для создания облаков тегов и всегда отображается вверху списка. Этот стоп-лист нельзя переименовать или удалить.Всегда присутствует как минимум один дополнительный стоп-лист.

      Чтобы добавить в проект новый стоп-лист, щелкните значок.

      После этого к проекту будет добавлен и открыт новый список. По умолчанию этому списку присвоено имя «Новый стоп-лист», и он может включать порядковый номер, чтобы исключить повторяющиеся имена. Название списка можно редактировать напрямую.

      Добавление новых слов в стоп-список

      Новые слова можно добавить в стоп-список двумя способами:

      Во-первых, вы можете ввести новые слова вручную, нажав кнопку New над панелью исключенных слов и введите слово.Можно добавить несколько слов, нажимая клавишу Enter после каждой записи.

      Во-вторых, вы можете добавлять слова прямо из списка частотности слов, дважды щелкнув зеленый символ в первом столбце, что избавляет от необходимости вводить слово. Несколько слов из списка частотности слов можно передать одновременно, сначала выделив их, а затем щелкнув значок «Добавить в стоп-лист» на панели инструментов.

      При использовании стоп-листов необходимо соблюдать следующее:

      • Слова стоп-листа автоматически сортируются в алфавитном порядке.Этот порядок предопределен и не может быть изменен. Если слово уже существует в стоп-листе, оно не будет вставлено.
      • Стоп-списки могут включать словосочетания, разделенные пробелами, например «Джордж Буш» или «Уолт Дисней».
      • Стоп-списки чувствительны к регистру. Это различие применяется только в том случае, если соответствующий параметр выбран в диалоговом окне параметров для функции.

      Дублировать, переименовывать и удалять стоп-листы

      Стоп-списки можно дублировать, например, если вы хотите изменить список, сохранив исходную версию. Щелкните правой кнопкой мыши стоп-лист и выберите Дублировать . После этого список будет продублирован и вставлен. Повторяющийся список будет иметь то же имя, что и исходный список, дополненный порядковым номером.

      Чтобы переименовать стоп-лист, щелкните список, чтобы выделить его, затем щелкните еще раз, чтобы изменить имя. Либо щелкните правой кнопкой мыши имя списка и выберите Переименовать .

      Опцию удаления списка также можно найти в контекстном меню.

      Применение стоп-листов к другим проектам

      Чтобы сохранить внутренний стоп-список проекта в качестве глобального списка для использования в других проектах, щелкните правой кнопкой мыши стоп-список и выберите Сохранить как глобальный стоп-список . Список будет продублирован и вставлен с тем же именем в нижнюю панель окна. Если имя списка уже существует, будет добавлен порядковый номер.

      Глобальные стоп-листы могут быть перенесены в любой проект:

      1. Щелкните правой кнопкой мыши список на панели окна «Глобальный стоп-лист».
      2. Выберите Копировать в проект из контекстного меню .

      Совет: Стоп-списки также можно перетаскивать из «Стоп-списков проекта» на панель «Глобальные стоп-списки».

      Подсказка: Когда вы открываете проект, который уже был открыт в версии 12.3 в более ранней версии MAXQDA, будет отображаться только пустой стоп-лист.

      Объединить стоп-листы

      Многие стоп-листы можно эффективно использовать в проектах.Рекомендуется использовать модуляризацию, что означает создание определенных типов стоп-листов (например, определенных и неопределенных статей), которые могут применяться повсеместно. При необходимости эти стоп-листы можно объединить в общие стоп-листы.

      1. Щелкните правой кнопкой мыши стоп-лист .
      2. Выберите Копировать в другой стоп-лист из контекстного меню.
      3. Выберите целевой стоп-лист из контекстного меню.

      После выбора целевого списка появляется подтверждающее сообщение, подтверждающее, хотите ли вы продолжить.Если вы подтверждаете запрос, два стоп-листа объединяются, то есть все исключенные слова из исходного списка вставляются в целевой список, пропуская уже существующие записи.

      Экспорт и печать стоп-листов

      Стоп-списки можно экспортировать в виде файлов для редактирования, печати или для документации и архивирования в других программах:

      1. Щелкните правой кнопкой мыши стоп-лист и выберите Экспорт или щелкните значок Export на верхней панели инструментов, чтобы экспортировать текущий отображаемый стоп-лист.
      2. Укажите имя и расположение файла в диалоговом окне.

      Список будет экспортирован в формат TXT (UTF-8), и его можно будет редактировать и распечатывать с помощью текстового редактора, текстового редактора или Excel.

      Импорт и увеличение стоп-листов

      MAXDictio позволяет загружать стоп-списки из файлов TXT, сохранять их как новые списки или интегрировать слова в существующий список.

      Щелкните значок Импорт списка , чтобы создать новый список из файла TXT.

      Щелкните значок Добавить в текущий список , чтобы объединить слова из импортированного стоп-списка и слова из текущего отображаемого стоп-списка.

      Загрузить предварительно настроенные стоп-листы

      В качестве бесплатной услуги мы предоставляем предварительно настроенные файлы стоп-листов, включая следующие подкатегории: вспомогательные элементы, предлоги, междометия, числительные, местоимения, определители, союзы, частицы (доступно только на немецком языке), 100 самые распространенные слова.

      Вы можете загрузить полный стоп-лист , содержащий все подкатегории (за исключением 100 наиболее употребительных слов) здесь:

      Скачать стоп-лист (английский) Скачать стоп-лист (немецкий)

      Скачать стоп-лист (испанский) Скачать стоп-лист (итальянский)

      Или загрузите zip-файл , включая отдельные файлы для каждой категории здесь:

      Загрузите zip-файл (на английском языке) Загрузите zip-файл (на немецком языке)

      Загрузите zip-файл (на испанском языке) Загрузите zip-файл (на итальянском языке) )

      Создание и редактирование списков остановки в программах Office

      Списки остановки хранятся как обычные текстовые файлы в формате UTF-8; их можно открывать и редактировать в любой программе Office.Excel — лучший вариант для редактирования стоп-листов. Откройте стоп-лист, выбрав Открыть файл в Excel. Тип файла необходимо изменить на «Все файлы».

      Теперь вы можете добавить или изменить список стоп-слов в Excel, а затем снова сохранить их. Сортировать список не обязательно, так как это будет сделано автоматически при открытии списка в MAXQDA.

      Расположение глобальных стоп-листов

      Глобальные стоп-листы хранятся MAXDictio в виде файлов в формате TXT (UTF-8) в следующей папке с файлами.Их также можно редактировать здесь с помощью внешних программ:

      Windows: локальная установка

      Documents / MAXQDA2020 / Dictio / Stoplist

      Mac: локальная установка

      Documents / MAXQDA / MAXQDA2020 / Dictio / Stoplist

      Windows и Mac: портативная установка на USB-накопителе

      USB-накопителе MAXQDA 2020 Files Dictio Stoplist

      Все файлы TXT в этих папках отображаются в MAXDictio в виде стоп-листов.

      стоп-листов

      Стоп-списки — это списки слов, которые вы не хотите включать в анализ.Например, вы можете захотеть составить список слов или проанализировать ключевые слова, исключая общие служебные слова, такие как, of, was, is, it.

      Чтобы использовать стоп-листы, вы сначала подготовите файл с помощью Блокнота или любого текстового редактора, в котором указаны все слова, которые вы хотите игнорировать. Разделите каждое слово запятыми или поместите каждое в новой строке. Вы можете использовать заглавные буквы или строчные буквы по своему усмотрению. Вы можете использовать точку с запятой для строк комментариев. Количество слов не ограничено.Стоп-списки не используют подстановочные знаки (списки соответствия могут).

      Есть файл с именем stop_wl.stp (в вашей папке \ wsmith7), который вы можете использовать как основу и сохранить под новым именем. Вы также найдете там basic_English_stoplist.stp, основанный на наиболее часто используемых элементах BNC. Или просто создайте свой собственный в Блокноте и сохраните его с расширением файла .stp. Если это сложно, переименуйте .txt в .stp.

      Пример

      ; Мой стоп-лист в тестовых целях.

      ЭТО, ЭТО

      IT

      УИЛЛ

      Затем выберите Stop List в меню, чтобы указать стоп-листы, которые вы хотите использовать. Отдельные стоп-листы можно использовать для программ WordList, Concord и KeyWords. Если стоп-лист активирован, он действует: то есть слова в нем не будут включены в список слов. Если вы хотите всегда использовать одни и те же стоп-листы, вы можете указать их в wordsmith7.ini как значения по умолчанию.

      Чтобы выбрать стоп-лист, нажмите маленькую желтую кнопку на снимке экрана, найдите файл стоп-списка и нажмите «Загрузить».Вы увидите, сколько записей было правильно найдено, и вам будут показаны первые несколько из них.

      Загрузив стоп-лист таким образом, начните новый список слов. Слова в вашем стоп-листе теперь не должны отображаться в списке слов.

      непрерывный

      Обычно каждое слово считывается при составлении списка слов и сохраняется в памяти компьютера без проверки того, является ли оно стоп-листом. В конце концов набор слов проверяется в вашем стоп-листе и пропускается, если он присутствует.Это намного быстрее. Однако это означает, что по большей части любая статистика вычисляется по всему тексту, без учета вашего стоп-листа.

      Если вы выберете «Непрерывный», обработка резко замедлится, так как при чтении каждого слова при составлении списка слов оно будет проверяться по стоп-списку и игнорироваться, если оно будет найдено. Другими словами, каждый отдельный случай THE, OF, IS и т. Д. Будет рассматриваться по мере чтения текстов и поиска в вашем стоп-листе. В результате вы получите подробную статистику без учета слов в стоп-листах.

      вычесть длины слов в статистике

      Если вы не выбрали непрерывную обработку, как описано выше, вы можете захотеть, чтобы статистика вашего списка слов попыталась частично обработать выполненную работу со списком остановок. При таком выборе после вычисления списка слов вся статистика, касающаяся количества типов и лексем, трех-, четырехбуквенных слов и т. Д., Будет скорректирована для всего столбца (но не для столбца для каждого отдельного текста). в вашей статистике.

      См. Список соответствий для более подробного объяснения со скриншотами.

      Другой метод создания файла стоп-списка — использовать WordList для большого объема текста, задав высокую минимальную частоту, если вы хотите только часто встречающиеся слова. Затем сохраните его как текстовый файл. Затем используйте Text Converter для его форматирования, используя stoplist.cod в качестве файла преобразования.

      стоп-листов в Конкорде

      В случае Concord стоп-лист может выполнять две задачи: во-первых, он будет вырезать слова из стоп-списка как совместимые. Кроме того, он может вырезать любые слова из стоп-списка в качестве совпадений для поискового слова: например, если вы соответствуете красоте * и в вашем стоп-списке есть слово «красивое», любые строки соответствия, содержащие «красивое», будут вырезаны (те, которые содержат «красоту», останутся).Чтобы это было активировано, убедитесь, что вы отметили поле поискового слова в настройках.

      Стоп-листы

      … доступны через кнопку Advanced Settings на контроллере

      .

      См. Также: Создание файла тегов, список соответствий, лемматизация.

      404 | Микро Фокус

    13. Профессиональные услуги

      Сформируйте свою стратегию и преобразуйте гибридную ИТ-среду.


    14. Профессиональные услуги по продуктам
    15. Аналитика и большие данные

      Помогите вам внедрить безопасность в цепочку создания стоимости ИТ и наладить сотрудничество между ИТ-подразделениями, приложениями и службами безопасности.

    16. Компьютерная безопасность

      Помогите вам быстрее реагировать и получить конкурентное преимущество благодаря гибкости предприятия.

    17. DevOps

      Ускорьте получение результатов гибридного облака с помощью услуг по консультированию, трансформации и внедрению.

    18. Консультации по цепочке создания стоимости IT4IT

      Службы управления приложениями, которые позволяют поручить управление решениями экспертам, разбирающимся в вашей среде.

    19. Управление доставкой приложений

      Услуги стратегического консалтинга для разработки вашей программы цифровой трансформации.

    20. Жизненный цикл мобильного приложения

      Полнофункциональное моделирование сценариев использования с предварительно созданными интеграциями в портфеле программного обеспечения Micro Focus, демонстрирующее реальный сценарий использования

    21. Управление гибридным облаком и брокерские услуги

      Услуги экспертной аналитики безопасности, которые помогут вам быстро спроектировать, развернуть и проверить реализацию технологии безопасности Micro Focus.

    22. Автоматизация ЦОД

      Служба интеграции и управления услугами, которая оптимизирует доставку, гарантии и управление в условиях нескольких поставщиков.

    23. Управление операциями

      Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

    24. Управление услугами

      Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

    25. Vertica

      Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

    26. Глобальная аутентификация продукта

      Мобильные услуги, которые обеспечивают производительность и ускоряют вывод на рынок без ущерба для качества.

    27. Управляемые службы

      Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

    28. Модельные офисы

      Комплексные услуги по работе с большими данными для продвижения вашего предприятия.

    29. стоп-лист: значение — словарь WordSense

      см. Также стоп-лист


      стоп-лист (английский)

      Существительное

      стоп-лист ( пл. стоп-листы )

      1. ( вычисление ) Список слов или других элементов данных, которые по какой-то особой причине должны игнорироваться или пропускаться определенной операцией обработки данных.
        Если вы снабдите свою поисковую систему стоп-листом, содержащим несколько общих слов, таких как «a», «the» и «и», вы можете уменьшить размер полнотекстового индекса примерно на 20%.
      2. ( media ) Список людей, которые подписались на публикацию (например, газету) и больше не желают ее получать.
      3. также стоп-лист Stoplist (английский) Noun Stoplist (pl.стоп-слова) Альтернативное написание стоп-списка

        стоп-слово : стоп-слово (английский) Альтернативные формы стоп-слово Существительное стоп-слово (мн. стоп-слова) вычисление — слово, обычно одно из серии в стоп-списке, которое должно быть игнорируется…

        стоп-листов : см. также стоп-листы стоп-листов (английский) Существительные стоп-списки Множественное число стоп-листов


        Поделиться


        Примечания, добавленные пользователями

        Для этой записи нет примечаний, добавленных пользователями.

        Добавить примечание

        Добавить пометку в запись «стоп-лист». Напишите подсказку или пример и помогите улучшить наш словарь. Не просите о помощи, не задавайте вопросов и не жалуйтесь.
        HTML-теги и ссылки не допускаются.

        Все, что нарушает эти правила, будет немедленно удалено.


        Далее

        стоп-листы (английский)
        Имя существительное
        стоп-листы
        Множественное число стоп-листов

        стоп-лосс (английский)
        Имя существительное
        стоп-лосс (счетный и несчетный; пл….

        стоп-лосс (английский)
        Альтернативные формы
        стоп-лосс
        Имя существительное
        стоп …

        стоп-лосс (английский)
        Имя существительное
        стоп-лосс
        Множественный стоп-лосс

        стоп-лосс (английский)
        Имя существительное
        стоп-лосс
        Множественный стоп-лосс

        стоп-движение (английский)
        Имя существительное
        остановка движения (бесчисленное множество)
        Альтернатива …

        остановка движения (английский)
        Имя существительное
        прекратить движение
        Множественное число stop motion

        stop off (английский)
        Глагол
        остановиться
        (непереходный) Сделать короткое…

        stop on a dime (английский)
        Глагол
        стоп на копейке (от третьего лица в единственном числе …

        стоп-приказ (английский)
        Имя существительное
        стоп-ордер (pl. стоп-ордера)
        Синоним …

        стоп-приказов (английский)
        Имя существительное
        стоп-приказы
        Множественное число стоп-приказа

        stop% 20list — определение английского языка, грамматика, произношение, синонимы и примеры

        Джентльмен остановился на месте и сказал мне сделать то же самое.

        Литература

        В Нью-Йорке было так много шумов, что я почти перестал их замечать.

        Литература

        OpenSubtitles2018.v3

        opensubtitles2

        Есть кто-то там, где люди делают действительно плохие вещи, миссис Залман, и я пытался остановить это .

        OpenSubtitles2018.v3

        Портал Европейского корпуса солидарности должен постоянно развиваться, чтобы обеспечить легкий доступ к Европейскому корпусу солидарности и предоставить магазин за одну остановку как для заинтересованных лиц, так и для организаций, в том числе в отношении регистрации, идентификации и сопоставления профилей и возможности, нетворкинг и виртуальные обмены, онлайн-обучение, языковая поддержка, а также вся другая поддержка до мероприятия солидарности, после мероприятия солидарности или того и другого, а также другие полезные функции, которые могут возникнуть в будущем.

        Eurlex2018q4

        Мы должны перестать так думать .

        Литература

        Он почти сказал это, слова коснулись его губ, но предупреждающий звонок в его голове остановил его .

        Литература

        OpenSubtitles2018.v3

        Остановить у бара на минуту

        opensubtitles2

        Он работал международным водителем до 11 сентября 2006 года, когда он прекратил работу из-за болезни.

        Eurlex2019

        ТЭП

        OpenSubtitles2018.v3

        OpenSubtitles2018.v3

        Согласно этой логике, либо мы владеем всем дождем, либо позволяем дождю быть , прекращаем , если мы хотим пить.

        WikiMatrix

        1 апреля 1916 г .: Экспрессы начали делать остановки на этой станции .

        KFTT

        Ну судороги прекратились

        opensubtitles2

        Кевин, ты перестанешь беспокоиться о ?

        OpenSubtitles2018.v3

        Тут же вошел кот, подошел к центру комнаты и остановился на глазах посторонних.

        Литература

        Комитет призывает государство-участник эффективно выполнять свое решение обеспечить регистрацию всех « прекращает и обыски» и выдавать копию формы записи соответствующему лицу.

        UN-2

        Его временно перевязали только для того, чтобы остановить кровотечение, и врач позвонил, чтобы отвезти.

        Литература

        Смею вас попытаться остановить меня.

        OpenSubtitles2018.v3

        Таксометр также должен отображать окончательное значение поездки в рабочем положении « Остановлено, ».

        ЕврЛекс-2

        Если бы он доложил об этом приключении своему начальству из КГБ, они сочли бы его слегка сумасшедшим, но приказали бы ему продолжить расследование дела до тех пор, пока у него не появится какое-то заключение, которое он мог бы представить, и, поскольку он прошел подготовку в КГБ, он мог бы не более остановить доводить факты до их заключения, чем он сможет остановить дыхание .

        ханглиш

        OpenSubtitles2018.v3

        Программное обеспечение для качественного анализа и исследования данных

        Семинар прошел замечательно! Возможность работать с ATLAS.ti для анализа данных была бесценной. Инструктор был основательным и мог объяснить вещи в манере, понятной для непрофессионала.

        Дениз Дж. Джонс Консультирование аспирантов по социальным вопросам, Университет Капеллы

        Этот семинар вышел далеко за рамки моих ожиданий с точки зрения полезности и применимости к моему исследованию.Тренер не только прекрасно разбирался в ATLAS.ti, но и его руководство по качественному кодированию данных было бесценным.

        Шерри Бут, MEd Докторант Пятница Институт образовательных инноваций, Государственный университет Северной Каролины

        Я был невероятно впечатлен сотрудниками ATLAS.ti и услугами, которые они предоставляют. Я чувствую себя очень хорошо, зная, что у вашей компании есть потрясающая поддержка, чтобы помочь мне. Не могу вспомнить, когда видел такую ​​отзывчивую команду.

        Трэйси Винтер Докторант

        Мне очень нравится, как преподаватель представляет, что такое ATLAS.ti и как он работает. Он систематически объясняет все функции и возможные варианты этого мощного программного обеспечения для качественного анализа данных.

        Фархард Моайери Координатор программы управления проектами в Centennial College, Торонто, Канада

        Семинар мне очень понравился; все было хорошо объяснено на практических примерах.Я приобрел лицензию ATLAS.ti и использую ее в своей докторской диссертации. Он работает очень хорошо и превзошел все мои ожидания.

        J. Pedro U, Мадрид

        Опыт инструктора в системе ATLAS.ti así como su metodología exitosa para ilustrar loscesses en el analisis de datos cualitativos проводит единственное выражение: Excelente.
        Gracias por compatir sus conocimientos; Creo que sería muy útil, si está dentro de las posibilidades, enviar a los asistentes la grabación de la videoconferencia y los símbolos utilizados para Disñar cuestionarios en Excel.Reitero mi agradecimiento, admiración y respeto.

        Хесус Эдуардо Пулидо, Венесуэла

        Это очень полезный курс для тех, кто проводит исследования с использованием качественной методологии и управляет большими объемами данных (любого типа)

        Родриго Дуэрте Докторант антропологии, UCM, Испания

        Практика вебинара ATLAS.ti была для меня очень полезна как инструментально, так и концептуально, она находится на превосходном уровне, а помощь чрезвычайно доступна.

        Эльвира ДеДубуа Докторант Автономного университета Барселоны

        El curso va muy bien, me encantaran las clases. Las explicaciones son muy claras y Presentan bien las herramientas de ATLAS.ti. ¡Muchas gracias otra vez por su disponibilidad y interese en ayudar! ¡Poder contar con ustedes es неоценим!

        Присцила Сато Докторант экологии, UM, Испания

        Курс ATLAS.ti был очень полезен как для обучения, так и для практики.Возможность асинхронного прохождения курса облегчает, с одной стороны, возможность корректировать учебные часы, когда у вас есть время, а не корректировать свое расписание для очного курса.

        Карла Родригес Гарсиа Докторант Университета Наварры, Испания

        В связи с курсом я выражаю искренние поздравления инструкторам за их внимательность и дружелюбие к проблемам и вопросам, которые у меня возникли на протяжении всего курса.

        Аугусто Секейрос Пумар Университет Барселоны

        Отличная программа обучения, если у вас никогда не было опыта работы с программным обеспечением для программирования или вам нужно начать большой проект!

        Чарльз Делани Профессор, Университет Альберты

        Курс был чрезвычайно полезен для тех, кто только начинал изучать использование программного обеспечения. Я надеюсь сгруппировать класс студентов и пройти следующий курс.

        Ноэми Спаньолетти Исследователь IP-USP, Бразилия

        ATLAS.ti Вводные веб-семинары представляют собой прекрасную возможность изучить основы этого программного обеспечения под руководством высококвалифицированных и опытных исследователей в области качественной информации. Я настоятельно рекомендую эти курсы профессионалам и исследователям, которые хотят использовать ATLAS.ti в своем анализе, но мало или совсем не знают, как это делать.

        Марвин Родригес Варгас Sociólogo Universidad de Costa Rica Banco Popular y de Desarrollo Comunal

        Было замечательно увидеть, насколько возможно организовать качественные данные с помощью ATLAS.ti помимо моих знаний традиционного количественного анализа, которые я знаю. Это значительно облегчит мою работу, спасибо ATLAS.ti.

        Читунг Саид Менеджер по качеству программ и обучению в Restless Development в Танзании

        Практическая презентация была очень полезна для развития лучшего понимания технических особенностей программы. Я прошел шестичасовой вебинар, но у меня остались вопросы, которые помогло прояснить личное занятие с инструктором.

        Элвин Джонс Докторант

        Класс предоставил очень полезную информацию и рекомендации относительно анализа различных типов данных. Большое количество статей, доступных в разделе «Ресурсы». Хороший обзор возможностей программы.

        Бет Ф. Картер Бихевиорист, Центры по контролю и профилактике заболеваний

        В дополнение к отличной презентации я очень признателен инструктору за быстрые ответы на наши вопросы в текстовых сообщениях.

        Дайан Л. Вольф, профессор социологии Univ. of California, Davis

        Я искал удобное программное обеспечение для облегчения анализа данных, и я очень благодарен за то, что нашел ATLAS.ti. Я очень рекомендую ATLAS.ti своим сокурсникам-аспирантам.

        Сити Мохамад Докторант, Университет Малайзии Сабах

        Часовой учебник был битком набит отличной информацией! Я очень рад начать использовать этот новый инструмент на моем Mac !!

        Herbert Lias Consultant, Utah

        En esta ocasión aprecié de forma más ejemplificada tanto los comandos, como las formas de integrationción, al estar la Instructora explicando.De igual, manera las explicaciones allowían seguir la visualización de los ejemplos que description. El taller evaluativamente fue excelente.

        Рейнальда Пиментель де Арроча Curricuista

        Исследователь сои. La docente del curso tuvo un alto grado de implación y disponibilidad, un alto grado de calidad docente y un alto conocimiento de la materia. ¡Очень рекомендую!

        Фелипе Гарсия Гусман Investigador

        El curso nos mostró las infinitas posibilidades que ofrece ATLAS.ti como herramienta para el análisis cualitativo de datos. La Instructora supo captar nuestra atención, introducirnos al uso del programa y enseñarnos su aplicabilidad.

        Claudia Romero Consultora (IESTQM, España)

        Me pareció una adecuada Introduction a Atlas.ti, bien manejado y algo que me pareció relvente fue la personalización que se dio a los membersantes. Indudablemente, dejan la inquietud suficiente para seguir conociendo y Practicando más del programa.

        Хавьер Кастильо Estudiante ITESO, Гвадалахара, Халиско. México

        El curso de ATLAS.ti является непостижимым для задачи / того, что используется программа. Abre un sinfín de posibilidades y el aprendizaje esta muy bien estructurado, resultando ameno y muy provchoso.

        Хулио Фернандес Decano Facultad Enfermeria Universidad de Valencia

        El curso fue impartido magistralmente por la profesora. Desearía que para un futuro cercano volviera a беспристрастный эль curso pero de forma más pausada.Es decir con una mayor duración en horas y distribuidas, por ejemplo a la largo de una semana para poder sedimentar los conocimientos adquiridos.

        Josefa Eugenia Blasco Profesora. Universidad de Alicante, España

        El curso me allowió conocer todas las posibilidades del programa para sacarle mejor provcho en mis proyectos devestigación y con mis estudiantes.

        Мария Гонсалес Profesora Universidad de Colima, México

        Me parece un valioso aporte realizar una индуктивное программное обеспечение, наиболее часто используемое в ATLAS.ти. Mis felicitaciones porque quedé gratamente sorprendida con las mejoras que tiene Atlas.ti en la versión Actual.

        Marisol Hernández Estudiante Doctorado en Tecnología Educativa Universitat de les Illes Balears

        Este taller nos dio la información básica de los Conceptos básicos y algunas posibilidades quea program of. Lo cierto es que deja una buenísima impresión el curso, quedándote con ganas de ampiar conocimientos sobre el mismo. Desde luego que, a la hora de realizar una researchación cualitativa, este programa me parece imprescindible.

        Фернандо Майербер Doctorando Ciencias Sociales. Universitat de València. España

        El context фактический exige una mayor comprensión en tanto las dinámicas son altamente cambiantes, por fortuna existe ATLAS.ti que te permite amar tu rol devestigador fastenando tanto el orden como el análisis de la información.

        Ana Maria Gutierrez Monsalve, Profesional en Planeación y Desarrollo Social, Institución Universitaria Colegio Mayor de Antiquia Medellin — Колумбия

        Меня зовут Рикардо Валлс, П.Гео. с 33-летним международным опытом работы в геологии. Я живу в Торонто, Канада, но работаю по всему миру. Я люблю науку и много исследую. Мне очень понравилась презентация. Это было остроумно, весело и одновременно серьезно. Спасибо!

        Ricardo Valls Toronto, Canada

        A mi parecer el curso es totalmente didáctico, se ha dado de manera pausada. Рассмотрим, что debo tener el programa abierto a la par e ir Practicando a medida que avanza la explicación.

        Ulina Mapp Candidata доктор в Ciencias de la education, Universidad de Panamá

        Al empezar a trabajar con ATLAS.ti cualquier formación extra es interesante. Ha sido un pequeño taller, al lado de las inmensas posibilidades de este software, pero a la vez muy productivo, animo a cualquiera a disfrutar de la formación que se ofrece, es un gran valor añadido el poder acceptder a ella ya los formadores, no es привычный encontrar este tipo de soporte.

        Нурия Мартинес Doctoranda en el CEU, Madrid, España.

        Mi nombre es Diana Gómez soy profesora de psicología, в Гвадалахаре, Халиско, Мексика; el curso me pareció interesante, practico y muy útil para el trabajo devestigación de los alumnos. Espero podercontinar con la Capacitación que ofrecen.

        Диана Гомес Псикология, Университет Гвадалахары

        Это был исключительный опыт обучения. Семинар был очень успешным. Все концепции и их применение были четко объяснены. Я очень рекомендую это качественным исследователям.

        Дина Мартинес-Тайсон, доктор медицины Луи де ла Парте, Флоридский институт психического здоровья, Университет Южной Флориды

        Семинар прошел замечательно! Возможность работать с ATLAS.ti для анализа данных была бесценной. Инструктор был основательным и мог объяснить вещи в манере, понятной для непрофессионала.

        Дениз Дж. Джонс, MEd hD Консультирование студентов по социальным вопросам, Университет Капеллы

        После посещения ATLAS.На семинаре я чувствую себя вправе продолжить и завершить систематический анализ моих качественных данных, полученных в результате моего диссертационного исследования. В частности, я знаю важность использования заметок для записи моих процессов

        Лиза Херви Стажер-исследователь, Пятничный институт инноваций в области образования Докторант по учебным программам и инструкциям, Государственный университет Северной Каролины

        Глава 3 Стоп-слова | Машинное обучение с учителем для анализа текста в R

        После того, как мы разбили текст на токены, часто становится ясно, что не все слова несут одинаковый объем информации, если она вообще есть, для задачи прогнозного моделирования.Общие слова, которые несут мало (или, возможно, не содержат) значимой информации, называются стоп-словами . Удаление стоп-слов для различных задач НЛП является обычным советом и практикой, но задача удаления стоп-слов является более тонкой, чем многие ресурсы могут заставить вас поверить. В этой главе мы исследуем, что такое список стоп-слов, различия между ними и последствия их использования в рабочем процессе предварительной обработки.

        Концепция стоп-слов имеет долгую историю: Гансу Питеру Люну приписывают создание этого термина в 1960 году (Luhn 1960).Примеры этих слов в английском: «a», «the», «of» и «didn’t». Эти слова очень распространены и обычно не добавляют большого значения тексту, но вместо этого обеспечивают правильную структуру предложения.

        Отнесение слов к категории информативных или неинформативных является ограничивающим фактором, и мы предпочитаем рассматривать слова как имеющие более плавный или непрерывный объем информации, связанной с ними. Эта информативность также зависит от контекста. Фактически, сами стоп-слова часто важны для определения жанра или авторства.

        Исторически одной из основных причин удаления стоп-слов было уменьшение времени вычислений для интеллектуального анализа текста; его можно рассматривать как уменьшение размерности текстовых данных, и он широко использовался в поисковых системах для получения лучших результатов (Huston and Croft 2010).

        Стоп-слова могут иметь разные роли в корпусе. Обычно мы делим стоп-слова на три группы: общие, тематические и документальные стоп-слова.

        Глобальные стоп-слова — это слова, которые почти всегда имеют мало значения для данного языка; это такие слова, как «of» и «and» в английском языке, которые необходимы для склеивания текста.Эти слова, вероятно, являются беспроигрышной ставкой для удаления, но их мало. Вы можете найти несколько глобальных стоп-слов в готовых списках стоп-слов (раздел 3.1).

        Далее идут стоп-слова для конкретных тем. Эти слова неинформативны для данной предметной области. Предметы могут быть широкими, например, финансы и медицина, или могут быть более конкретными, например, некрологи, нарушения норм здоровья и списки вакансий для библиотекарей в Канзасе.
        Такие слова, как «ванна», «спальня» и «прихожая», как правило, не считаются стоп-словами в английском языке, но они могут не предоставить много информации для дифференциации списков загородных домов и могут быть предметом стоп-слов для определенного анализа.Скорее всего, вам придется вручную создать такой список стоп-слов (раздел 3.2). Такие стоп-слова могут улучшить вашу работу, если у вас есть опыт в предметной области, чтобы составить хороший список.

        Наконец, у нас есть стоп-слова на уровне документа. Эти слова не предоставляют никакой или большой информации для данного документа. Их сложно классифицировать, и не стоит труда их идентифицировать. Даже если вы можете найти стоп-слова в документе, неясно, как включить такого рода информацию в задачу регрессии или классификации.

        Использование готовых списков стоп-слов

        Быстрый вариант использования стоп-слов — получить список, который уже был создан. Это привлекательно, потому что это несложно, но имейте в виду, что не все списки созданы равными. Nothman, Qin и Yurchak (2018) обнаружили некоторые тревожные результаты в исследовании 52 списков стоп-слов, доступных в пакетах программного обеспечения с открытым исходным кодом. Среди наиболее серьезных проблем были орфографические ошибки («fify» вместо «пятьдесят»), включение явно информативных слов, таких как «компьютер» и «плакать», а также внутренние несоответствия, такие как включение слова «имеет», но не слово «делает».Это не означает, что вы никогда не должны использовать список стоп-слов, который был включен в проект программного обеспечения с открытым исходным кодом. Однако вы всегда должны проверять и проверять список, который вы используете, чтобы убедиться, что он не изменился с момента последнего использования, а также чтобы убедиться, что он подходит для вашего варианта использования.

        Сегодня доступен широкий выбор списков стоп-слов. В целях этой главы мы сосредоточимся на трех списках английских стоп-слов, предоставляемых пакетом стоп-слов (Benoit, Muhr и Watanabe 2021).Первый из них взят из Информационно-поисковой системы SMART (Система механического анализа и поиска текста), системы поиска информации, разработанной в Корнельском университете в 1960-х годах (Lewis et al. 2004). Второй — это английский список стоп-слов Snowball (Портер, 2001), а последний — английский список из коллекции Stopwords ISO. Все эти списки стоп-слов считаются универсальными, а не зависящими от предметной области.

        Пакет стоп-слов Пакет содержит исчерпывающую коллекцию списков стоп-слов в одном месте для простоты использования при анализе и других пакетах.

        Прежде чем мы начнем углубляться в содержимое списков, давайте посмотрим, сколько слов включено в каждый из них.

          библиотека (стоп-слова)
        длина (стоп-слова (source = "smart"))
        длина (стоп-слова (источник = "снежок"))
        длина (стоп-слова (source = "stopwords-iso"))  
          #> [1] 571
        #> [1] 175
        #> [1] 1298  

        Длина этих списков совершенно разная: самый длинный список более чем в семь раз длиннее самого короткого! Давайте рассмотрим совпадение слов, которые появляются в трех списках на графике UpSet на рисунке 3.1. График UpSet (Lex et al. 2014) визуализирует пересечения и агрегаты пересечений множеств с использованием матричного макета, представляющего количество элементов, а также сводную статистику.

        РИСУНОК 3.1: Установите пересечения для трех общих списков стоп-слов, представленных в виде графика UpSet

        График UpSet на рис. 3.1 показывает нам, что эти три списка являются почти истинными подмножествами друг друга. Единственное исключение — набор из 10 слов, которые появляются в Snowball и ISO, но не в списке SMART.Что это за слова?

          setdiff (stopwords (source = "snowball"),
                стоп-слова (source = "smart"))  
          #> [1] "она" "он" "она бы" "он" "она" "не" "не должна"
        #> [8] "когда" "почему" "как"  

        Все эти слова — сокращения. Это , а не , потому что лексика SMART не содержит сокращений; если посмотреть, их почти 50.

          str_subset (stopwords (source = "smart"), "'")  
          #> [1] "а" "не" "не" "давай" "с" "не могу"
        #> [7] "не мог" "не" "не" "не" "не было" "не было"
        #> [13] "не" "он" "вот" "я бы" "я буду" "я"
        #> [19] "у меня" "не" "было бы" "это будет" "это" "давай"
        #> [25] "не должно" "это" "это" "там" "они бы" "они"
        #> [31] "они" "у них" "не было" "мы бы" "мы" "мы"
        #> [37] "мы" "не были" "что" "где" "кто" "не будет"
        #> [43] "не будет" "вы бы" "вы" "вы" "вы"  

        Похоже, мы наткнулись на несоответствие: почему SMART включает «он» , а не «она» ? Трудно сказать, но это, возможно, стоит исправить, прежде чем применять эти списки стоп-слов для анализа или предварительной обработки модели.Этот список стоп-слов, вероятно, был создан путем выбора наиболее часто встречающихся слов в большом корпусе текста, который больше соответствует тексту о мужчинах, чем о женщинах. Это еще раз напоминание о том, что мы всегда должны внимательно смотреть на любой заранее составленный список слов или другой артефакт, который мы используем, чтобы убедиться, что он соответствует нашим потребностям.

        Вполне приемлемо начать с готового списка слов и удалить или добавить дополнительные слова в соответствии с вашим конкретным вариантом использования.

        При выборе списка стоп-слов важно учитывать его размер и широту.Наличие небольшого и краткого списка слов может умеренно уменьшить количество токенов, не оказывая при этом слишком большого влияния на ваши модели, если вы выбрали подходящие слова. По мере увеличения размера вашего списка стоп-слов каждое добавленное слово будет иметь убывающий положительный эффект с увеличением риска того, что значимое слово было помещено в список по ошибке. В Разделе 6.4 мы показываем влияние различных списков стоп-слов на обучение модели.

        Удаление стоп-слова в R

        Теперь, когда мы увидели списки стоп-слов, мы можем продолжить удаление этих слов.Конкретный способ удаления стоп-слов зависит от формы наших данных. Если у вас есть текст в аккуратном формате с одним словом в строке, вы можете использовать filter () из dplyr с инвертированным % в% , если у вас есть стоп-слова в качестве вектора, или вы можете использовать anti_join () из dplyr , если стоп-слова находятся в tibble () . Как и в предыдущей главе, давайте рассмотрим текст «Елки» Ганса Христиана Андерсена и воспользуемся форматным текстом , чтобы преобразовать текст в слова.

         Библиотека  (hcandersenr)
        библиотека (тидиверс)
        библиотека (tidytext)
        
        fir_tree <- hca_fairytales ()%>%
          filter (книга == "Елка",
                 language == "английский")
        
        tidy_fir_tree <- fir_tree%>%
          unnest_tokens (слово, текст)  

        Давайте возьмем для примера список стоп-слов Snowball. Поскольку стоп-слова возвращаются из этой функции как вектор, мы будем использовать filter () .

          tidy_fir_tree%>%
          filter (! (слово% в% стоп-словах (source = "snowball")))  
          #> # Tibble: 1,547 × 3
        #> слово на языке книги
        #>   
        #> 1 Елка английская далека
        #> 2 Елка английский лес
        #> 3 Елка английская теплая
        #> 4 Елка английское солнышко
        #> 5 Елка английская фреш
        #> 6 Елка английская воздушная
        #> 7 Елка английского производства
        #> 8 Елка английская сладкая
        #> 9 Елка английская отдыхает
        #> 10 Елка английское заведение
        #> #… С еще 1,537 строками  

        Если вместо этого мы используем функцию get_stopwords () из tidytext , то мы можем использовать функцию anti_join () .

          tidy_fir_tree%>%
          anti_join (get_stopwords (source = "snowball"))  
          #> # Tibble: 1,547 × 3
        #> слово на языке книги
        #>   
        #> 1 Елка английская далека
        #> 2 Елка английский лес
        #> 3 Елка английская теплая
        #> 4 Елка английское солнышко
        #> 5 Елка английская фреш
        #> 6 Елка английская воздушная
        #> 7 Елка английского производства
        #> 8 Елка английская сладкая
        #> 9 Елка английская отдыхает
        #> 10 Елка английское заведение
        #> #… С еще 1,537 строками  

        Результат этих двух удалений стоп-слов одинаков, поскольку в обоих случаях мы использовали один и тот же список стоп-слов.

        Создание собственного списка стоп-слов

        Еще один способ получить список стоп-слов — создать его самостоятельно. Давайте рассмотрим несколько разных способов подобрать подходящие слова. В качестве первого примера мы будем использовать токенизированные данные из «Елки». Давайте возьмем слова и оценим их по количеству или частоте.

        1:

        2: и

        3: дерево

        4: это

        5:

        6: в

        7: из

        8: к

        9: i

        10: было

        11: они

        12: пихта

        13: были

        14: все

        15: с

        16: но

        17: на

        18: затем

        19: было

        20: это

        21: в

        22: маленький

        23: так

        24: не

        25: сказал

        26: что

        27: as

        28: тот

        29: он

        30: вы

        31: это

        32: из

        33: be

        34: их

        35: это

        36: филиалы

        37: пришел

        38: для

        39: сейчас

        40: один

        41: история

        42: будет

        43: лес

        44: иметь

        45: как

        46: знаю

        47: мысль

        48: мыши

        49: деревья

        50: ср

        51: было

        52: вниз

        53: ох

        54: очень

        55: когда

        56: где

        57: воз

        58: детский

        59: Болтай

        60: Шалтай

        61: или

        62: должен

        63: есть

        64: а

        65: будет

        66: после

        67: по

        68: приходи

        69: счастливый

        70: мой

        71: старый

        72: только

        73: их

        74: который

        75: снова

        76: утра

        77: are

        78: красивый

        79: вечер

        80: его

        81: нравится

        82: мне

        83: подробнее

        84: около

        85: рождество

        86: до

        87: упал

        88: свежие

        89: из

        90: здесь

        91: последние

        92: много

        93: нет

        94: принцесса

        95: высокий

        96: молодой

        97: спросил

        98: банка

        99: мог

        100: плакал

        101: иду

        102: выросло на

        103: если

        104: большой

        105: посмотрел

        106: произведено

        107: многие

        108: видел

        109: лестница

        110: думаю

        111: слишком

        112: вверх

        113: да

        114: воздух

        115: также

        116: прочь

        117: птицы

        118: угол

        119: разрез

        120: сделал

        Мы распознаем многие из того, что мы считаем стоп-словами в первом столбце здесь, за тремя большими исключениями.Мы видим «дерево» на 3, «ель» на 12 и «маленький» на 22. Эти слова занимают первые места в нашем списке, но они предоставляют ценную информацию, поскольку все они относятся к главному герою. Что пошло не так с этим подходом? Создание списка стоп-слов с использованием часто встречающихся слов лучше всего работает, когда он создается на корпусе документов, а не на отдельном документе. Это потому, что слова, найденные в одном документе, будут специфичными для документа, и общий шаблон слов не будет так хорошо обобщен.

        В НЛП корпус — это набор текстов или документов. Сборник сказок Ганса Христиана Андерсена можно считать корпусом, где каждая сказка — это документ в этом корпусе. Набор заключений Верховного суда США можно рассматривать как отдельный корпус, причем каждое письменное мнение является документом в пределах этого корпуса . Оба набора данных более подробно описаны в Приложении B.

        Слово «дерево» кажется важным, поскольку оно относится к главному герою, но оно также может появляться так часто, что перестает предоставлять какую-либо информацию.Давайте попробуем другой подход, извлекая часто встречающиеся слова из корпуса всех английских сказок Х.К. Андерсен.

        1:

        2: и

        3: из

        4:

        5: к

        6: в

        7: было

        8: это

        9: он

        10: то

        11: i

        12: она

        13: имел

        14: его

        15: они

        16: но

        17: as

        18: ее

        19: с

        20: для

        21: это

        22: на

        23: сказал

        24: вы

        25: не

        26: были

        27: так

        28: все

        29: be

        30: в

        31: один

        32: есть

        33: его

        34: из

        35: иметь

        36: маленький

        37: затем

        38:

        39: их

        40: это

        41: старый

        42: из

        43: мог

        44: когда

        45: в

        46: сейчас

        47: воз

        48: мой

        49: их

        50: по

        51: ср

        52: будет

        53: нравится

        54: ар

        55: что

        56: если

        57: мне

        58: вверх

        59: очень

        60: будет

        61: нет

        62: было

        63: около

        64: более

        65: где

        66:

        67: как

        68: только

        69: пришел

        70: или

        71: вниз

        72: отлично

        73: хорошо

        74: до

        75: подробнее

        76: здесь

        77: его

        78: сделал

        79: мужчина

        80: см.

        81: банка

        82: через

        83: красивый

        84: должен

        85: имеет

        86: прочь

        87: мысль

        88: все еще

        89: чем

        90: колодец

        91: человек

        92: время

        93: до

        94: день

        95: прочие

        96: стояла

        97: слишком

        98: пошел

        99: приходи

        100: никогда

        101: много

        102: дом

        103: знаю

        104: каждые

        105: посмотрел

        106: многие

        107: снова

        108: глаза

        109: наш

        110: довольно

        111: молодой

        112: даже

        113: должен

        114: дерево

        115: вперед

        116: ваш

        117: длинный

        118: при

        119: два

        120: вода

        Этот список больше подходит для нашей концепции стоп-слов, и теперь пришло время сделать некоторый выбор.Сколько мы хотим включить в наш список стоп-слов? Какие слова мы должны добавить и / или удалить, основываясь на предыдущей информации? Выбор количества удаляемых слов лучше всего производить в индивидуальном порядке, поскольку может быть сложно определить априори, сколько разных «бессмысленных» слов появляется в корпусе. Мы предлагаем начать с небольшого числа, например 20, и увеличивать на 10 слов, пока не дойдете до слов, которые не подходят в качестве стоп-слов для ваших аналитических целей.

        Следует иметь в виду, что такой список не идеален.В зависимости от того, как ваш текст был сгенерирован или обработан, странные токены могут появляться как возможные стоп-слова из-за ошибок кодирования или оптического распознавания символов. Кроме того, эти результаты основаны на корпусе имеющихся у нас документов, что потенциально необъективно. В нашем примере все сказки были написаны одним и тем же европейским белым человеком начала 1800-х годов.

        Это предвзятость можно свести к минимуму, удалив слова, которые, как мы ожидаем, будут чрезмерно представлены, или добавив слова, которые, как мы ожидаем, будут недопредставлены.

        Простые примеры — включить дополнения к словам в списке, если их еще нет. Включите «большой», если присутствует «маленький», «старый», если присутствует «молодой». В этом примере списка есть слова, связанные с женщинами, которые часто занимают более низкое положение, чем слова, связанные с мужчинами. Если «мужчина» находится на 79-м ранге, а «женщина» — на 179-м ранге, выбор порогового значения 100 приведет к включению только одного из этих слов. В зависимости от того, насколько важны, по вашему мнению, такие существительные в ваших текстах, подумайте о добавлении «женщина» или удалении «мужчина» .

        На рис. 3.2 показано, как слова, связанные с мужчинами, имеют более высокий рейтинг, чем слова, связанные с женщинами. Используя единый порог для создания списка стоп-слов, вы, вероятно, включите только одну форму таких слов.

        РИСУНОК 3.2: Жетоны, ранжированные в соответствии с общим количеством вхождений, при этом ранг 1 имеет наибольшее количество вхождений.

        Представьте, что теперь мы хотели бы создать список стоп-слов, охватывающий несколько разных жанров, таким образом, чтобы тематические стоп-слова не пересекались.В этом случае мы хотели бы, чтобы слова обозначались как стоп-слово только в том случае, если оно является стоп-словом во всех жанрах. Вы можете найти слова по отдельности в каждом жанре и использовать правильные пересечения. Однако такой подход может занять много времени.

        Ниже показан неудачный подход, при котором мы пытаемся создать многоязычный список стоп-слов. Для этого мы вычисляем частоту обратного документа (IDF) каждого слова. IDF слова — это величина, которая является низкой для часто используемых слов в коллекции документов и высокой для слов, которые часто не используются в коллекции документов.Обычно определяется как

        .

        \ [idf (\ text {term}) = \ ln {\ left (\ frac {n _ {\ text {documents}}} {n _ {\ text {документы, содержащие термин}}} \ right)} \]

        Если слово «собака» встречается в 4 из 100 документов, то у него будет idf («собака») = log (100/4) = 3,22 , а если слово «кошка» встречается в 99 из 100 документы тогда у него будет idf ("cat") = log (100/99) = 0,01 . Обратите внимание, как значения idf стремятся к нулю (на самом деле, когда термин появляется во всех документах, тогда idf этого слова равен 0 log (100/100) = log (1) = 0 ), тем больше документов он содержится в.Что произойдет, если мы создадим список стоп-слов на основе слов с наименьшим IDF? Следующая функция принимает токенизированный фрейм данных и возвращает фрейм данных со столбцом для каждого слова и столбцом для IDF.

         Библиотека  (rlang)
        calc_idf <- function (df, word, document) {
          слова <- df%>% pull ({{word}})%>% unique ()
          n_docs <- длина (уникальная (pull (df, {{document}})))
          n_words <- df%>%
            гнездо (данные = c ({{слово}}))%>%
            тянуть (данные)%>%
            map_dfc (~ слова% в% unique (pull (.х, {{слово}})))%>%
            rowSums ()
          
          tibble (слово = слова,
                 idf = журнал (n_docs / n_words))
        }  

        Вот результат, когда мы пытаемся создать кросс-языковой список стоп-слов, беря каждую сказку как документ. Это не очень хорошо!

        Перекрытие между словами, которые встречаются в каждом языке, очень мало, но именно эти слова мы чаще всего видим в этом списке.

        1:

        2: de

        3: мужчина

        4: en

        5: da

        6: se

        7: es

        8:

        9: в

        10: ее

        11: мне

        12: так

        13: нет

        14: i

        15: для

        16: ден

        17: в

        18: der

        19: было

        20: du

        21: er

        22: dem

        23: более

        24: грех

        25: он

        26: все

        27: ja

        28: иметь

        29: к

        30: мит

        31: все

        32: о

        33: будет

        34: утра

        35: la

        36: пел

        37: le

        38: des

        39: y

        40: un

        41: que

        42: на

        43: мужчины

        44: стенд

        45: al

        46: si

        47: сын

        48: Хан

        49: сер

        50: et

        51: lo

        52: умереть

        53: всего

        54: bien

        55: vor

        56: las

        57: дель

        58: все еще

        59: земля

        60: менее

        61: имеет

        62:

        63: по

        64: as

        65: не

        66: конец

        67: быстро

        68: шляпа

        69: см.

        70: но

        71: из

        72: это

        73: и

        74: o

        75: alt

        76: война

        77: ni

        78: su

        79: время

        80: фон

        81: рука

        82:

        83: то

        84: это

        85: из

        86: есть

        87: сидеть

        88: с

        89: por

        90: el

        91: кон

        92: una

        93: be

        94: они

        95: один

        96: como

        97: перо

        98: их

        99: было

        100: vi

        101: das

        102: его

        103: лес

        104: sagte

        105: ist

        106: ein

        107: и

        108: zu

        109: пункт

        110:

        соль

        111: auf

        112: sie

        113: nicht

        114: абер

        115: сич

        116: затем

        117: были

        118: сказал

        119: в

        120: más

        Это не сработало, потому что между общими словами очень мало совпадений.Вместо этого давайте ограничимся вычислением только одним языком и вычислим IDF каждого слова, которое мы можем найти, по сравнению со словами, которые встречаются во многих документах.

        1:

        2:

        3: и

        4: к

        5: в

        6: то

        7: это

        8: но

        9: из

        10: было

        11: as

        12: есть

        13: на

        14: в

        15: это

        16: для

        17: с

        18: все

        19: не

        20: они

        21: один

        22: он

        23: его

        24: так

        25: их

        26: be

        27: из

        28: имел

        29: затем

        30: были

        31: сказал

        32: в

        33: по

        34: иметь

        35: который

        36: это

        37: вверх

        38: из

        39: что

        40: воз

        41: нет

        42:

        43: сейчас

        44: i

        45: только

        46: старый

        47: нравится

        48: когда

        49: если

        50: маленький

        51: более

        52: are

        53: очень

        54: вы

        55: его

        56: ср

        57: отлично

        58: как

        59: их

        60: пришел

        61: было

        62: вниз

        63: будет

        64: где

        65: или

        66: она

        67: банка

        68: мог

        69: около

        70: ее

        71: будет

        72: время

        73: хорошо

        74: должен

        75: мой

        76: чем

        77: прочь

        78: подробнее

        79: имеет

        80: мысль

        81: сделал

        82: прочие

        83: все еще

        84: до

        85: даже

        86: до

        87: мне

        88: знаю

        89: много

        90: см.

        91: здесь

        92: хорошо

        93: через

        94: день

        95: слишком

        96: человек

        97: собственный

        98: приходи

        99: его

        100: целиком

        101: всего

        102: многие

        103: никогда

        104: произведено

        105: стояла

        106: еще

        107: посмотрел

        108: снова

        109: скажем

        110: май

        111: да

        112: пошел

        113: каждые

        114: каждая

        115: такое

        116: мир

        117: около

        118: длинный

        119: глаза

        120: вперед

        На этот раз мы получаем лучшие результаты.Список начинается с «а», «то», «и» и «до» и продолжается многими более разумными вариантами стоп-слов. Нам нужно просмотреть эти результаты вручную, чтобы превратить их в список. Нам нужно опуститься в ранге настолько низко, насколько нам удобно. Вы, как специалист по данным, полностью контролируете, как вы хотите создать список. Если вы не хотите включать «мало», вы все равно можете добавить «есть» в свой список, даже если оно находится ниже в списке.

        Все списки стоп-слов зависят от контекста

        Контекст важен при моделировании текста, поэтому важно убедиться, что используемый вами словарь стоп-слов отражает пространство слов, в котором вы планируете его использовать.Одна общая проблема, которую следует учитывать, — это то, как местоимения привносят информацию в ваш текст. Местоимения включены во множество различных списков стоп-слов (хотя и непоследовательно), но они часто , а не , будут помехой в текстовых данных. Аналогичным образом Bender et al. (2021) обсуждают, как список из примерно 400 «грязных, непослушных, непристойных или ино нецензурных слов» использовался для фильтрации и удаления текста перед обучением модели большого языка с триллионом параметров, чтобы защитить ее от изучения ненормативной лексики, но авторы указывают что в контексте некоторых сообществ такие слова используются повторно или используются для описания маргинализованной идентичности.

        С другой стороны, иногда вам придется добавлять слова самостоятельно, в зависимости от домена. Если вы работаете с текстами для рецептов десертов, определенные ингредиенты (сахар, яйца, вода) и действия (взбивание, выпечка, перемешивание) могут быть достаточно частыми, чтобы преодолеть порог стоп-слова, но вы можете оставить их такими, какими они могут быть. познавательный. Выбрасывание «яиц» в качестве общего слова затруднит или сделает совершенно невозможным определение, являются ли определенные рецепты веганскими или нет, в то время как взбивание и перемешивание можно удалить, поскольку различие между рецептами, которые требуют и не требуют венчика, может быть неуместным. это большое дело.

        Что происходит при удалении стоп-слов

        Мы обсудили различные способы поиска и удаления стоп-слов; теперь давайте посмотрим, что произойдет, когда вы их удалите. Во-первых, давайте исследуем влияние количества слов, включенных в список. На рис. 3.3 показано, какой процент слов удаляется в зависимости от количества слов в тексте. Разные цвета представляют три разных списка стоп-слов, которые мы рассмотрели в этой главе.

        РИСУНОК 3.3: Доля удаленных слов для разных списков стоп-слов и разной длины документа

        Мы замечаем, как и предполагали, что большие списки стоп-слов удаляют больше слов, чем более короткие списки стоп-слов. В этом примере со сказками было удалено более половины слов, а в самом большом списке удалено более 80% слов. Мы заметили, что в более коротких текстах процент стоп-слов ниже. Поскольку мы смотрим на сказки, это можно объяснить тем фактом, что историю нужно рассказывать независимо от длины сказки, поэтому более короткие тексты будут более плотными с более информативными словами.

        Другая проблема, с которой вы можете столкнуться, — это неправильное написание.

        Большинство готовых списков стоп-слов предполагают, что все слова написаны правильно.

        Обработка орфографических ошибок при использовании заранее составленных списков может выполняться вручную путем добавления распространенных орфографических ошибок. Вы можете представить себе создание всех слов, которые находятся на определенном строковом расстоянии от стоп-слов, но мы не рекомендуем этого делать, так как таким образом вы быстро включите информативные слова.

        Одним из недостатков создания собственных списков стоп-слов с использованием частот является то, что вы ограничены использованием слов, которые вы уже наблюдали.Может случиться так, что слово «она» будет включено в ваш учебный корпус, но слово «он» не достигнет порогового значения. Это тот случай, когда вам нужно взглянуть на свои слова и внести соответствующие коррективы. Здесь большие готовые списки стоп-слов могут послужить источником вдохновения для поиска пропущенных слов.

        В разделе 6.4 мы исследуем влияние удаления стоп-слов в контексте моделирования. Если составить правильный список слов, мы не видим вреда для производительности модели, а иногда и улучшения за счет снижения шума (Feldman, and Sanger 2007).

        Стоп-слова на языках, отличных от английского

        До сих пор в этой главе мы сосредоточились на английских стоп-словах, но английский не является репрезентативным для всех языков. Понятия «короткие» и «длинные» списки, которые мы использовали до сих пор, характерны для английского языка как языка. Вы должны ожидать, что в разных языках будет разное количество «неинформативных» слов, и это количество будет зависеть от морфологического богатства языка; списки, содержащие все возможные морфологические варианты каждого стоп-слова, могут стать довольно большими.

        В разных языках разное количество слов в каждом классе слов. Примером может служить влияние грамматического падежа на артикли, используемые на немецком языке. В следующих таблицах показано использование определенных и неопределенных артиклей в немецком языке. Обратите внимание, что у немецких существительных есть три рода (мужской, женский и средний), что нередко в языках мира. Статьи почти всегда считаются стоп-словами на английском языке, поскольку они несут очень мало информации. Однако немецкие статьи дают некоторое представление о падеже, которое можно использовать при выборе списка стоп-слов на немецком языке.

        Мужской Женский нейтральный Множественное число
        именной der умереть дас die
        винительный падеж день умереть дас die
        dative дем der дем den
        Родительный падеж из der из der
        Мужской Женский нейтральный
        именной ein eine ein
        Винительный падеж einen eine ein
        Дательный einem einer einem
        Родительный падеж eines einer eines

        Составление списков стоп-слов на китайском языке выполнялось как вручную, так и автоматически (Zou, Wang, Deng, Han, and Wang, 2006), но до сих пор ни один из них не был принят в качестве стандарта (Zou, Wang, Deng, and Han 2006).Полное обсуждение определения стоп-слов в китайском тексте выходит за рамки этой книги, поэтому мы просто выделим некоторые из проблем, которые отличают его от английского.

        Китайский текст намного сложнее, чем изображенный здесь. С разными системами и миллиардами пользователей мы не сможем затронуть здесь многое.

        Основное отличие от английского — использование логограмм вместо букв для передачи информации. Однако китайские иероглифы не следует путать с китайскими словами.Большинство слов в современном китайском языке состоит из нескольких символов. Это означает, что сделать вывод о наличии слов сложнее, и понятие стоп-слов повлияет на то, как выполняется сегментация символов.

        Сводка

        Во многих стандартных рабочих процессах НЛП удаление стоп-слов представлено как вариант по умолчанию или как правильный выбор без комментариев. Хотя удаление стоп-слов может повысить точность вашего машинного обучения с использованием текстовых данных, выбор такого шага сложен.Содержание существующих списков стоп-слов сильно различается, и доступные стратегии создания собственных могут иметь как тонкие, так и не очень заметные эффекты на результаты вашей модели.

        Из этой главы вы узнали:

        • что такое стоп-слово и как удалить стоп-слова из текстовых данных

        • как разные списки стоп-слов могут отличаться

        • , что влияние удаления стоп-слова различно для разных типов текстов

        • о предвзятости, встроенной для остановки списков слов, и стратегиях построения таких списков

        Бендер, Э.М., Гебру Т., Макмиллан-Мейджор А. и Шмитчелл С. 2021. «Об опасностях случайных попугаев: могут ли языковые модели быть слишком большими? 🦜. » В Proceedings of the 2021 ACM Conference on Fair of Fair, Accountability and Transparency , 610–623. FAccT ’21. Нью-Йорк, штат Нью-Йорк: Ассоциация вычислительной техники. https://doi.org/10.1145/3442188.3445922.

        Бенуа К., Мур Д. и Ватанабе К. 2021. стоп-слов: многоязычные списки стоп-слов . Пакет R версии 2.2. https://CRAN.R-project.org/package=stopwords.

        Фельдман Р. и Сэнгер Дж. 2007. The Text Mining Handbook . Кембридж: Издательство Кембриджского университета.

        Хьюстон, С., Крофт, В. Б. 2010. «Оценка методов обработки подробных запросов». In Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval , 291–298. СИГИР ’10. Нью-Йорк, штат Нью-Йорк: ACM. http://doi.acm.org/10.1145/1835449.1835499.

        Льюис, Д. Д., Янг, Ю., Роуз, Т. Г., и Ли, Ф. 2004. «Rcv1: Новая коллекция тестов для исследования категоризации текста.” Journal of Machine Learning Research 5: 361–397. https://www.jmlr.org/papers/volume5/lewis04a/lewis04a.pdf.

        Лекс А., Геленборг Н., Стробельт Х., Вийемот Р. и Пфистер Х. 2014. «UpSet: визуализация пересекающихся множеств». Транзакции IEEE по визуализации и компьютерной графике 20 (12): 1983–1992. https://doi.org/10.1109/TVCG.2014.2346248.

        Лун, Х. П. 1960. «Контекстный указатель ключевых слов для технической литературы (kwic Index)». Американская документация 11 (4): 288–295.https://onlinelibrary.wiley.com/doi/abs/10.1002/asi.50

        403.

        Мохаммад, С. М., Терни, П. Д. 2013. «Краудсорсинг словаря ассоциаций слов и эмоций».

        Вычислительный интеллект 29 (3): 436–465. https://onlinelibrary.wiley.com/doi/abs/10.1111/j.1467-8640.2012.00460.x.

        Нотман Дж., Цинь Х. и Юрчак Р. 2018. «Списки стоп-слов в бесплатных пакетах программного обеспечения с открытым исходным кодом». In Proceedings of Workshop for NLP Open Source Software (NLP-OSS) , 7–12. Мельбурн, Австралия: Ассоциация компьютерной лингвистики.https://www.aclweb.org/anthology/W18-2502.

        Портер, М. Ф. 2001. «Snowball: язык для построения алгоритмов». https://snowballstem.org.

        Цзоу Ф., Ван Ф. Л., Дэн Х. и Хань С. 2006. «Оценка списков стоп-слов в китайском языке». In Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC’06) . Генуя, Италия: Европейская ассоциация языковых ресурсов (ELRA). http://www.lrec-conf.org/proceedings/lrec2006/pdf/273_pdf.pdf.

        Цзоу, Ф., Ван, Ф.Л., Дэн, X., Хан, С., и Ван, Л. С. 2006. «Автоматическое построение списка стоп-слов на китайском языке». In Proceedings of the 5th WSEAS International Conference on Applied Computer Science , 1009–1014. ACOS’06. Стивенс-Пойнт, Висконсин: World Scientific; Инженерная академия; Общество (WSEAS). http://dl.acm.org/citation.cfm?id=1973598.1973793.

        .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *