Отдел продаж

Телефоны: (3532) 25-27-22, 93-60-02, 93-50-02

E-mail: [email protected]

г.Оренбург, ул.Беляевская, д.50/1, стр.1

 

Разное

Грунтовкой унигрэм технические характеристики: Грунтовкой унигрэм технические характеристики, огрунтовка металлических поверхностей СНиП

Содержание

Грунтовка — модификатор ржавчины МС





    Грунтовки-модификаторы ржавчины. Это более эффективные препараты, чем указанные выше модификаторы ржавчины, так как содержат в своем составе полимерный пленкообразователь. Благодаря этому компоненту грунтовки-модификаторы ржавчины образуют на преобразованной поверхности слой грунта, к которому хорошо прилипают все противокоррозионные мастики. [c.108]

    Ниже рассматриваются грунтовки-преобразователи ржавчины и модификаторы ржавчины, выпускаемые отечественной промышленностью. [c.164]










    Грунтовку — модификатор ржавчины наносят кистью на поверхность, очищенную от пластовой и рыхлой ржавчины и протертую мокрой ветошью. [c.43]

    Эта грунтовка представляет собой водную систему, основными компонентами которой являются поливинил ацетатная дисперсия, ортофосфорная кислота, желтая й красная кровяные соли. Изготавливают ее в Соответствий с ТУ 81—05—121—79 и поставляют потребителю в двух упаковках-емкостях в одной находится так называемая основа,.в другой-—ортофосфорная кислота. Потребитель смешивает содержимое этих упаковок непосредственно перед.употреблением. Подробнейшая информация о том, как надо обращаться с этим необычным лакокрасочным материалом, содержится в Инструкции по приготовлению и применению грунтовки — модификатора ржавчины Э-ВА1-01 ГИСИ , изданной Горьковским инженерностроительным институтом в 1979 году. [c.26]

    С поверхностью, обработанной этим модификатором ржавчины, сочетаются перхлорвиниловые, глифталевые, фенольные, акриловые, эпоксидные грунтовки. [c.30]

    Разработать принципиально новый лакокрасочный материал совсем не просто. Появление такого материала — событие большого значения, происходящее раз в три-пять лет. За последние 20—30 лет появились такие новые лакокрасочные материалы, как водоэмульсионные, порошковые, для электрофоретического нанесения,, грунтовки для ржавых поверхностей (модификаторы ржавчины), для нанесения в электрическом поле. [c.61]

    Химические средства подготовки металлических поверхностей (модификаторы ржавчины и грунтовки) рекомендуются для использования в тех случаях, когда нельзя применять современные методы и средства удаления ржавчины (дробеструйная, пескоструйная очистка, травление), а также когда на поверхности металла после очистки остаются продукты коррозии. Допустимая для модификации толщина слоя продуктов коррозии — не более 100 мкм. [c.74]

    Одним из способов повышения биологической стойкости материала может быть введение в его состав ядовитых для организмов веществ — биоцидов. Например, для повышения стойкости к биокоррозии поливинилацетатной дисперсии, а также различных материалов на ее основе, в том числе и грунтовки — модифиатора ржавчины Э-ВА-01 ГИСИ, автор предложил использовать катании — поверхностно-активное вещество, относящееся к классу катионоактивных четвертичных солей. Изучение его как биоцида, проведенное на кафедре физиологии и биохимии растений ГГУ, показало его отличную способность подавлять жизнедеятельность многих в идов грибов. Грунтовка —модификатор ржавчины Э-ВА-01ГИСИ, в составе которой есть катапин, получила название грунтовки Э-ВА-019ГИСИ. [c.77]










    В условиях монтажной площадки можно применять такие виды очистки пескоструйная кварцевым или стальным песком дробеструйная стальными щетками модификаторами или грунтовками — преобразователями ржавчины. [c.105]

    Грунтовки-модификаторы разрешается использовать в том случае, если современные средства очистки от ржавчины (песко- и дробеструйная очистка) не применимы, а также после очистки ручным способом. [c.107]

    Поверхности, обработанные модификаторами ржавчины, загрунтовывают грунтовками ГФ-021 или ГФ-0119, затем при необходимости проводят шпатлевание, а потом окрашивание. Если есть возможность, то лучше не шпатлевать, так как слой шпатлевки может быть самым уязвимым, самым быстро выходящим из строя элементом многослойного лакокрасочного покрытия. [c.109]

    Очистка преобразователями ржавчины. Этот способ заключается в обработке металлической поверхности специальными растворами (грунтовками) — преобразователями, или модификаторами ржавчины, которые, взаимодействуя с продуктами коррозии, переводят их в неактивные (нерастворимые) комплексы. [c.467]

    Модификаторы ржавчины и грунтовки наносят в 1 слой, кроме тех случаев, когда они применяются защитных покрытий. 2. Сроки службы приведены для наиболее жестких условий эксплуатации. [c.32]

    Эффективным методом повышения долговечности пер-хлорвиниловых покрытий оказалось и нанесение их на металлическую поверхность, обработанную грунтовкой — модификатором ржавчины Э-ВА-01 ГИСИ. Из-за высокой эластичности грунта из нее, а также хорошей адгезии перхлорвинилового покрытия к этому грунту долговечность защитного покрытия в условиях агрессивных атмосфер больше, чем у аналогичных защитных покрытий, сформированных даже на очищенной поверхности. [c.34]

    Среди термоэластопластов, приемлемых для противокоррозионных целей, особенно интересным является герметик 51 Г-10 (другое название герметик 14ТЭП-1), представляющий собой однородную пастообразную массу черного цвета, которую с помощью кисти, валика, шпателя можно легко нанести на металлическую или бетонную поверхность, подготовленную так же, как это обычно де-ляется для лакокрасочных материалов. Можно наносить этот герметик и на ржавую поверхность, предварительно обработанную грунтовкой — модификатором ржавчины Э-ВА-01ГИСИ. [c.37]

    Сотрудниками кафедры химии ГИСИ и завода были проведены поиски защитных систем, устойчивых к условиям, соответствующим режиму работы туннельных сушил. В результате были рекомендованы два варианта защиты, ранее нигде не применявшихся. Первый вариант-обработка проржавевшего металла грунтовкой — модификатором ржавчины Э-ВА-01 ГИСИ и органосиликатной эмалью марки ВН-30 ДТС, которую в два слоя наносят на модифицированную поверхность. [c.43]

    Наряду с катапином были изучены и другие вещества, способные, по нашему предположению, не только быть биоцидами, но и улучшать основные функциональные свойства грунтовки —модификатора ржавчины, например параформ, аминоканифоль, полиэтиленамин. Все они оказались неплохими добавками в материалы на основе поливинилацетатной дисперсии, во всяком случае более эффективными, чем пентахлорфенолят натрия, применявшийся для подавления биокоррозии до наших работ. Пентахлорфенолят натрия не обеспечивает длительной надежной защиты от поражения грибами, обладает сильным, резким запахом, очень токсичен, окрашивает дисперсию в темный цвет, ухудшает ее пленкообразующие свойства. [c.78]

    Грунтовки-модификаторы ржавчины бывают такие ЭВА-0112 ТУ 6-10-1234-79, ЭВА-01-ГИСИ ТУ 81-05-121-78 (разработана Горьковским инженерно-строительным институтом им. В. П. Чкалова) МС-0152 ТУ 6-10-100-96-77 (разработана и выпускается Ленинградским НПО Пигмент ) ЭП-0180 ТУ 6-10-1658-82 (разработана Ленинградским НПО Лакокрас-цокрытие совместно с институтом неорганической химии АН ЛатвССР и выпускается предприятиями Союзкраски) ингибированный модификатор ржавчины № 444 ТУ 6-02-7-19-73 (выпускается Редкинским опытным заводом пос. Редкино, Калининской области). [c.74]

    Дш1 повышения защитных и декоративных свойств грунтовки-модификатора ржавчины в ее состав введены пигменты и наполнители, а также кошхлексообразователи и ингибито , эффективность а штимальные концентрации которых определялись электрохимическими методаш и ускоренными испытаниями. [c.161]

    ГПК ЭВА-0112 (ТУ 6-10-1234—79) — грунтовка-модификатор ржавчины, представляет собой двухупако-вочную систему, состоящую из основы и 85 %-ной ортофосфорной кислоты, смешиваемых непосредственно перед применением в соотношении 100 3. Нанесение состава должно быть осуществлено в течение 24 ч. Срок хранения основы — 6 мес при температуре не ниже О X. В состав ЭВА-0112 рекомендуется вводить карбонат бария, 4,4-диаминдифенил, бензидин по 0,05. .. 0,5 %, ГПК эффективен в сочетании с эпоксидными ЛКП. [c.613]

    ГПК ЭВА-01-ГИСИ (ТУ 81-05-121—79) — грунтовка— модификатор ржавчины, представляет собой двухупаковочную систему, состоящую из основы и 70 %-ного раствора ортофосфорной кислоты (ОФК), смешиваемых в соотнонюнии 100 (5. .. 7). Основу составляет поли-Бинилацетатная дисперсия (ПВАД) с добавками желтой и красной кровяной солей (ЖКС и ККС) и ПАВ ОП-7 (ОП-Ю). Известны следующие модификации ГПК ЭВА-01-ГИСИ  [c.613]

    Грунтовки-модификаторы ржавчины ЭВА-01-ГИСИ и ЭВА-0112 применяют для обработки ржавых стальных конструкций, не имеющих прямого контакта с водой, топливом и пищевыми грузами, на строящихся и ремонтируемых морских и речных судах. Рекомендовано грунтовками-модификаторами обрабатывать судовые конструкции, трюмы, маши но-котельные отделения, надводные борта, надстройки, дымовые трубы, поверхности в районе второго дна и другие труднодоступные места, эксплуатируемые в условиях высокой влажности и контактирующие с топливом и водой, за исключением цистерн для питьевсй воды (см. табл. 54.3, 54.4). [c.635]










    НПО Спектр разработана грунтовка — модификатор ржавчины ЭП-0199, которая применяется для защиты изделий, эксплуатирующихся в агрессивных средах. Грунтовка хорошо сочетается с химостойкими материалами на хлорвиниловой и эпоксидной основе. [c.42]

    Определенный интерес для антикоррозионной техники представляет грунтовка — модификатор ржавчины ЭП-0199 на основе эпоксидной смолы. Грунтовка представляет собой суспензию пигментов и наполнителей в растворе эпоксидной смолы Э-40 с введением специальных добавок и пластификатора. Грунтовка ЭП-0199 предназначается для применения в комплексных системах химостойких лакокрасочных покрытий для грунтования прокорродированных поверхностей черных металлов (толщина слоя коррозии до 100 мкм), подвергающихся воздействию промышленной атмосферы, содержащей агрессивные газы и пары, либо кратковременному обливу кислотами и щелочами. [c.136]

    Эффективность грунтовок-модификаторов определяется не только природой пленкообразователя, но и наличием специальных добавок, обеспечивающих пропитку ржавчины и максимальную стабилизацию продуктов коррозии. Промышленность выпускает грунтовки-модификаторы на основе водоразбавляемых пленкообразователей (ВА-ВА-0112, ВД-ВА-01 ГИСИ, ВД-К4-0184, ВД-К4-0251), и эпоксидные модификаторы (ЭН-0180, ЭП-0199 и ЭН-0191). [c.286]

    Главным компонентом основы и по значимости, и по удельной массе является гомополимерная пластифицированная поливинилацетатная дисперсия (ПВАД)ушред- тaвляющE я собой взвесь шариков (глобул) полимера поливинилацетата в водном растворе другого полимера— поливинилового спирта. Именно благодаря этой дисперсии грунтовка Э-ВА-01 ГИСИ и завоевала доминирующую роль среди модификаторов ржавчины. Она оказалась не просто пленкообразователей, а компонентом многостороннего действия. Например, ПВАД проявляет хорошую пенетрирующую (проникающую) способность по отношению к ржавчине, укрепляет и уплотняет ее, обеспечивает высокую адгезию как пленки грунта к ржавому металлу, так- и покровных красок к пленке грунта. [c.26]

    Как наиритовые, так и битумно-наиритовые покрытия можно наносить не только на тщательно очищенную пескоструйным методом поверхность, но и на грунт — модификатор ржавчины Э-ВА-01ГИСИ, сформированный на ржавой поверхности, что позволяет, во-первых, исключить надобность в хлорнаиритовой грунтовке, а, во-вторых, снизить трудоемкость. [c.41]

    Модификаторы ржавчины имеют лишь преобразующую функцию. Обработанную ими поверхность необходимо перед окрашиванием грунтовать традиционными грунтовками [20]. [c.163]

    Модификаторы ржавчины (преобразователи). Грунтовка Э-ВА-0112 ТУ 6-10-1234-79 состоит из основы и кислотного отвердителя (основа — суспензия пигментов в пластифицированной поливинилацетатной эмульсии, кислотный отвердитель— 85 %-ная ортофосфорная кислота). Она предназначается для грунтования корродированных поверхностей черных металлов с толщиной продуктов коррозии до 100 мкм. Грунтовка неморозостойка, используется ири температуре не ниже О °С. Ее поставляют комилектно. Смешание комионентов ироиз-водится непосредственно перед применением. [c.47]

    ГПК Э-КЧ-0184 (ТУ 6-10-19Ш—83) — грунтовка-модификатор, представляет собой суспензию пигментов и наполнителей в карбоксилированном стирол-бутадиено-вом латексе БСК-65/ЗМ, в водной фазе которого находится несколько растворенных компонентов. Предназначена для защиты от коррозии стальных и чугунных изделий, на поверхности которых есть остатки ржавчины и окалины. [c.626]

    Грунтовка-модификатор ФПР-1 представляет собой водную дисперсию, образованную 2-метилвинилпириди—новым латексом ДМВП-10Х, фосфорной кислотой, эмульгатором ОП-7 и оксидом трехвалентного хрома. Предназначена для окрашивания изделий, покрытых слоем ржавчины, толщиной до 100 мкм. [c.630]

    Резервуары, предназначенные для хранения светлых нефтепродуктов (бензина, топлива для дизельных и реактивных двигателей), изготовляют из стали марки Ст , которая подвержена коррозионному разрушению. Ремонт необходим через 4. .. 5 лет. Всего резервуар служит 20. .. 25 лет при расчетном сроке службы 80. .. 100 лет. Кроме этого, нефтепродукты засоряются ржавчиной и другими загрязнениями. Приходится тщательно очищать нефтепродукты перед употреблением. В резервуарах интенсивно корродируют днище и придонная часть (высотой до 50 см) нижнего пояса. Коррозия происходит главным образом за счет воды, выделяющейся из нефти и скапливающейся на дне резервуара, а также за счет растворенных в ней солей. Корродируют также кровля, фермы и верхние пояса резервуара. В этом случае причиной коррозии является газовая фаза над нефтепродуктом, содержащая пары воды и углеводорода, а также кислород, сероводород и углекислый газ. Для ащиты рекомендуют Г1К, например грунтовку-модификатор ЭВА-01-ГИСИ, для защиты этой грунтовкой кровли, ферм и верхних поясов всех наземных резервуаров под светлое топливо. [c.634]

    Область применения Условия эксплуатации по ГОСТ 1 с. -г ) с сг с сг. Модификаторы ржавчины 1 1 1 Грунтовка Покрывной ЛКМ Число покрывных С.10СВ Срок с.и жбы, лет [c.30]

    ОЛластъ применения Услови плуа по г Г-. 1 о о. я экс-ации ОСТ 1 S сл Модификаторы ржавчины Грунтовка Покрывной ЛКМ Число покрывных слоев срок службы, лет [c.32]

    Указанные грунтовки представляют собой суспензию пигментов и наполнителей в карбоксилированном сти-рол-бутадиеновом латексе с добавлением модификатора ржавчины и различных вспомогательных веществ (эмульгаторов, стабилизаторов и т.д.). Применяются для защиты металлической поверхности с плотносцеплеиной ржавчиной и остатками окалины. Хорошо сочетаются с покрытыми материалами — эпоксидными, перхлорви-ниловыми и др. Грунтовку наносят на поверхность кистью, валиком или пневматическим распылителем. [c.42]

    Любое самое надежное лакокрасочное покрытие, нанесенное на заржавевшую поверхность, через короткий срок начнет разрушаться (рис. 17). Поэтому необходимо перед окраской тщательно удалять продукты коррозии. Лучший способ-это пескоструйная обработка, поскольку ручная обработка абразивной шкуркой очень трудоемка. Однако не все детали можно подвергать пескоструйной обработке. И тут на помощь приходят так называемые модификаторы ржавчины. Существуют два типа модификаторов протравные составы и специальные грунтовки. Первые из них-это водные растворы ортофосфорной кислоты, которые содержат танниды, желтую или красную кровяную соль. Компоненты состава реагируют со ржавчиной, переводя ее в неактивное состояние. Г рунтовки изготовляют на основе поливинилацетатной дисперсии, карбоксилсодержапщх и других полимеров. Некоторые из них, например грунтовки на основе поливинилацетатной дисперсии, не содержат органических растворителей, благодаря чему могут применяться в за- [c.87]

    АО «Ским» в течение последних 5 лет выпускает эпоксидные ЛКП-преобразователи ржавчины грунтовку ИНКОР и грунт-эмаль УНИГРЭМ. Это — материалы типа ЭП-0199 (разработка ОАО НИИ ЛКП с ОМЗ «Виктория»). Выполняют одновременно функции преобразователя (модификатора) ржавчины, грунтовочного и покрывного ЛКП. Являются универсальными средствами для эффективной защиты как прокорродировавших, так и «чистых» металлических конструкций. По сведениям производителей, данные ЛКП не уступают лучшим зарубежным аналогам. Обеспечивают срок службы Пк не менее 5 лет. [c.13]

    В [9] сообщается об эпоксидной грунтовке с модификатором ржавчины «Элакс ЭП-0199». Грунтовка предназначена для защиты металлических поверхностей при пониженной степени подгоговки поверхности. Применяется как самостоятельное покрытие и в качестве грунтовки в комплексных системах ЛКП. [c.13]


Грунтовкой унигрэм технические характеристики: огрунтовка металлических поверхностей

Как правильно красить металлические поверхности

Существует ошибочное мнение, что не покрасив кровлю или какие-либо металлоконструкции, можно тем самым сэкономить свои средства, однако как показывает практика, неокрашенные поверхности или окрашенные не правильно в итоге обходятся гораздо дороже!

Со временем все металлы подвержены коррозии, а вода является непременным участником данного процесса. Против коррозии металлов применяются специальные краски, такие как краска КО-42/42Т, эмаль ОС-1201, грунт ПФ-0294, грунт ХВ-050, грунтовка ЭП-0228, эмаль ЭП-1305, эмаль ЭП-5285 и ЭП-5287.

Ремонт ванной комнаты Часть 1 Подготовка стен

МАСТЕР Т.В. =========================== Строительные и отделочные работы в Волгоградской обл. в г. Михайло…

Выбирать краску по металлу нужно в соответствии с объектом покраски и условиями его дальнейшей эксплуатации.

Виды окрашиваемой поверхности

Способ окрашивания зависит от материала металлоконструкции. Чаще всего встречаются металлоконструкции из черного железа, из оцинкованного железа или металлоконструкции из цветных металлов (таких как алюминий, медь и т.д.).

Самыми распространенными являются поверхности из черного железа, однако у них имеется существенный недостаток, они быстро покрываются ржавчиной, поэтому их окраска обязательна. Для предохранения конструкций от ржавчины рекомендуется алкидные грунтовки, такие как грунт ГФ-021 и с содержанием цинковых соединений, например грунтовка ЭП-057. Обычно красят такие поверхности масляными красками МА-15 (реже алкидными ПФ-115). Так же можно посоветовать акриловые водно-дисперсионные грунт-эмали по металлу ВД-АК-111 или эмаль АК-124.

У акриловых красок эластичность больше, чем у масляных и алкидных. Это имеет важное значение для металлов, из-за больших линейных расширений вызываемых температурными колебаниями. Такое покрытие служит дольше, обладает более высокой и независящей от старения стойкостью, но обойдется немного дороже.

В атмосферных условиях срок службы акрилового покрытия составит не менее 5 лет, а масляного и алкидного – 3 года.

Новое цинковое покрытие имеет сложную поверхность для окрашивания, так как адгезия (сцепления с поверхностью) красочных покрытий обычно слабая. Снип огрунтовка металлических поверхностей за один раз грунтовкой гф 021? Например, масляные и алкидные краски на оцинкованной поверхности прослужат не более одного сезона.

Для увеличения адгезии может применяться обработка едкими кислотными растворами или кислотосодержащими грунтовками. Едкие грунтовки можно наносить непосредственно на поверхность, но они неустойчивы к влаге и конденсации, что усложняет их применение на месте. Наиболее подходящими для окраски оцинкованной кровли являются акриловые эмали АК-1316, грунт АК-069 и эпоксидные эмали ЭП-1305 и грунт ЭП-057, т.к. оцинковка требует от краски пластичности и повышенной адгезии, чем и отличаются вышеперечисленные краски.

На алюминиевых покрытиях сильную коррозию может вызвать воздействие таких веществ как фтор и едкие натрий и калий, хлор, бром, известковые и цементные растворы, мокрый бетон. Из-за этого эксплуатация алюминиевых строений и конструкций длительный период времени требует дополнительной антикоррозийной защиты. В качестве грунтовки алюминиевой поверхности подойдет грунт ВЛ-02 или ВЛ-023, а так же ФЛ-03К, для поверхностей, эксплуатирующихся в условиях температуры до 200°C, рекомендуется грунт ФЛ-086.

В качестве эмали применяется ХС-436, которая обладает высокими показателями противокоррозионных свойств, стойкостью к истиранию, атмосферостойкостью, водостойкостью.

Конструкции из меди, бронзы, свинца и т.д. традиционно считаются коррозионно-стойкими и обычно не требуют защиты. Обычно они окрашиваются только в декоративных целях. В качестве эмали подойдет АК-1316 и ПФ-1315.

Перед их нанесением обычно проводится струйная обработка с неметаллическим абразивом либо механическая шлифовка и обезжиривание. После этого наносят 2 слоя покрытия прямо на поверхность (поскольку из-за коррозионной стойкости этих металлов нанесение грунтовок и подслоев не является необходимым), причем первый слой необходимо разбавить на 10 % для улучшения адгезии. Чаще всего для покрытия цветных металлов используют эпоксидный лак ЭП-741 и ЭП-730.

Реже применяют полиуретановый лак ВД-УР-175.

Если с гальванизированной сталью используются гайки, болты либо зажимы, то и данные детали должны быть гальванизированы, т.к. в данных областях ускоряется возникновение ранней коррозии.

Подготовка поверхности

Перед нанесением покрытий, поверхность нужно тщательно очистить от мусора. После этого следует удалить ржавчину и старую краску наждачной бумагой или металлической щеткой с помощью растворителя. Затем шлифовальной бумагой зашлифовывают стык между очищенным участком и прочным лакокрасочным покрытием до образования плавного перехода.

Ржавчину также можно удалить при помощи химических средств, таких как преобразователь ржавчины. Его наносят на предварительно очищенные от грязи и обезжиренные поверхности с помощью кисти. Работать следует в резиновых перчатках и защитных очках.

Начать красить кровлю можно только через 4-5 суток после полного высыхания состава.

Обязательно следует удалять с поверхности масляные пятна, пыль и другие загрязнения. Для этого достаточно промыть поверхность с помощью мыльной воды либо других чистящих средств, затем ополоснуть чистой водой и дать высохнуть. Если поверхность окрашивается впервые, то ее достаточно промыть водой и обезжирить.

Огрунтовка поверхности

После очистки производится грунтование поверхности, необходимое для обеспечения лучшего сцепления краски с металлом. Кроме этого, грунтовка изолирует металлическую поверхность от влаги и тем самым защищает ее от коррозии. Огрунтовка металлических поверхностей за один раз грунтовкой эп 057?

Грунтовка выбирается в зависимости от вида металла, так как для некоторых видов важна высокая антикоррозийная защита, а некоторым металлам более важно сцепление (адгезия).

В случае, если металл уже покрыт ржавчиной, его необходимо обработать специальным антикоррозионным составом «три в одном»: преобразователь ржавчины, грунт и декоративное покрытие в одной банке, такие как грунт-эмаль ХВ-0278 и «Ржавоед-универсал». Они преобразуют старую ржавчину и будут препятствовать возникновению новой. Такие составы наносят валиком либо распылителем прямо на ржавчину толщиной до 0,1 мкм, предварительно счистив ее рыхлый слой.

Нанесение данных составов позволяет продлить жизнь наносимых на их поверхность декоративных антикоррозионных красок минимум в два раза.

Существуют грунтовки, такие как ВЛ-02 или ВЛ-023, которые при нанесении распылителем покрывают поверхность не ровно, хлопьями, это связано с их быстрой сушкой. Грунтовка начинает сохнуть уже в процессе распыления, поэтому данные грунтовки наносят валиком или кистью.

Основными недостатками грунтовок являются их низкая атмосферо-, ударо- и износостойкость, низкие декоративные свойства. Для улучшения данных свойств поверх грунтовки наносят соответствующее покрытие.

При выборе грунтовки следует отдать предпочтение покрытиям с более длительным сроком службы — чем он дольше, тем ниже эксплуатационные затраты.

Нанесение декоративно-защитного покрытия

Для декоративно-защитного покрытия традиционно используют алкидные и масляные краски. Однако, они обладают низкой эластичностью и, следовательно, служат не очень долго. Обычно уже через несколько лет такие краски начнут отслаиваться от поверхности.

Нельзя использовать алкидные и масляные краски для поверхностей из оцинкованного железа, для них используют акриловые водно-дисперсионные и эпоксидные эмали.

Для покрытия металла краской можно использовать кисти, валик или специальный распылитель для краски. Наиболее оптимальным будет покрытие, нанесенное из распылителя, способного залить труднодоступные и неровные участки и сделать слой краски идеально равномерным, в отличие от валика или кисти.

Окраску необходимо проводить при следующих условиях:

  • Температура воздуха: 18 °С — 35 °С;
  • Температура поверхности при нанесении: на 3 °С выше точки росы;
  • Температура состава: более 15 °С;
  • Влажность воздуха: 40 — 85%.

Кроме этого, необходимо защитить неотвержденное покрытие от воздействия прямых солнечных лучей. Прежде чем наносить следующий слой, необходимо дать краске высохнуть примерно полчаса. Нельзя сушить слой больше 2 часов, чтобы не допустить полного отвердения. Огрунтовка металлических поверхностей за один раз грунтовкой пф 115?

Возможна принудительная сушка материала при температуре 40°С.

Очистка инструмента производится следующими растворителями: 646, изопропанол, ацетон, этанол, бутилацетат.

Дополнительная информация:

Перед нанесением покрытий, поверхность нужно тщательно очистить от мусора. После этого следует удалить ржавчину и старую краску наждачной бумагой или металлической щеткой с помощью растворителя. Затем шлифовальной бумагой зашлифовывают стык между очищенным участком и прочным лакокрасочным покрытием до образования плавного перехода. Ржавчину также можно удалить при помощи химических средств, таких как преобразователь ржавчины. Его наносят на предварительно очищенные от грязи и обезжиренные поверхности с помощью кисти.

Работать следует в резиновых перчатках и защитных очках. Начать красить кровлю можно только через 4-5 суток после полного высыхания состава.

Грунтовочный состав обладает мощными антикоррозийными свойствами. ЭП-057 полностью водонепроницаема и предотвращает влияние электролита на поверхность металлоконструкции. Грунт не только надежно защищает металл от агрессивного воздействия влаги, но и замедляет уже начавшиеся коррозийные процессы.

130 ОТЕЧЕСТВЕННЫЕ ПРОИЗВОДИТЕЛИ ЛКМ — PDF Free Download

1 130 ОТЕЧЕСТВЕННЫЕ ПРОИЗВОДИТЕЛИ ЛКМ Краска ВД-АК Био интерьерная водно-дисперсионная, краска МА-15 Био масляная, эмаль ПФ-115 Био пентафталевая (ТУ ) Наносится кистью, валиком, пневмораспылителем в 1 2 слоя. Перед нанесением состав следует тщательно перемешать, при необходимости разбавить водой. Температура окружающей среды при нанесении и сушке состава должна быть не ниже 8 С. Время высыхания между слоями при температуре С 1 час. Расход на однослойное покрытие г/м 2 в зависимости от вида древесины. Лакокрасочные материалы марки «Био» (разработаны и освоены совместно с АО «Лакма-Имэкс») Относятся к классу принципиально новых ЛКМ. Представляют собой суспензию пигментов и наполнителей в различных пленкообразующих с добавлением вспомогательных веществ и специальной биологической добавки, обеспечивающей получение покрытия с бактерицидными, вирулицидными, спороцидными и фунгицидными свойствами. Предназначены для окрашивания внутри помещений по бетонным, асбоцементным, оштукатуренным, кирпичным, деревянным и другим пористым поверхностям с целью снижения уровня микробного загрязнения помещений в медицинских учреждениях, школах, детских садах, офисах и т. п. Основной цвет белый. Колеруются в различные цвета и оттенки по системам «Московская палитра», RAL, NSC. Выпускаются также цветные краски: голубая, серая, желтая, зеленая, бежевая, кремовая и др. Наносятся на подготовленную поверхность кистью, валиком или методом распыления Перед применением биопродукт следует тщательно перемешать. Расход на однослойное покрытие г/м 2 в зависимости от цвета. М. М. Федотов, О. П. Кириченко, Н. Н. Богатова

2 131 АО «СКиМ» (ОАО «Завод строительных красок и мастик») , г. Москва, Варшавское ш., д. 37а АО «СКиМ» (ОАО «Завод строительных красок и мастик») выросло из небольшого предприятия, основанного в 1932 г. В гг. были введены в эксплуатацию два новых производственных корпуса и установлено современное оборудование отечественного и зарубежного производства, в т. ч. диспергирующее, смешивающее и расфасовочное оборудование ведущих в этой области фирм «Ателье Суссмайер», «Нетч», «Оливер». АО «СКиМ» специализируется на производстве лакокрасочных материалов и герметизирующих мастик, выпуская до 40 тыс. т продукции в год. Использование отечественной и западной технологий позволило предприятию освоить производство широкого ассортимента лакокрасочной продукции. В настоящее время АО «СКиМ» одно из самых крупных предприятий в России по производству лакокрасочных и отделочных фасадных материалов. Материалы для строительства и ремонта АО «СКиМ» не только производит материалы для современного строительства и отделки, но и участвует в работах по реконструкции жилищного фонда и реставрации архитектурных памятников. В результате предприятием накоплен большой опыт в области ремонта и обновления фасадов, который с успехом применяется, гарантируя заказчикам квалифицированный выбор технологии подготовки поверхности и ее окраски. На выбор правильного типа краски влияет географическое положение здания и особенности применяемой строительной техники. В ассортимент АО «СКиМ» включены органорастворимые, водорастворимые (неорганические) и водоразбавляемые краски. Силикатные краски (ГОСТ ) содержат в качестве пленкообразующего жидкое калийное стекло. Применяются для покрытия неокрашенной штукатурки или поверхности, ранее окрашенной неорганической (известковой, силикатной, известково-цементной) краской. Рекомендуются для окрашивания прочных бетонных поверхностей, влажность которых постоянно выше нормальной. Такими объектами являются подземные переходы, водонапорные башни и т. п. АО «СКиМ» выпускает силикатные краски, предназначенные для наружной и внутренней отделки зданий и сооружений. Это двухупаковочные краски. Они состоят из сухой пигментной части и жидкого калийного стекла, которые перед употреблением смешивают в соотношении 1:1 (по массе). Период силикатизации краски (время образования необратимой пленки) не более 8 часов. Силикатные краски относятся к числу экологически полноценных лакокрасочных материалов, они пожаробезопасны и долговечны. При точном соблюдении правил подготовки поверхности и нанесения краски срок эксплуатации покрытий составляет более 15 лет. Силикатными красками АО «СКиМ» окрашены фасады зданий музея-усадьбы «Кусково», Исторического музея в Москве и др.

3 132 ОТЕЧЕСТВЕННЫЕ ПРОИЗВОДИТЕЛИ ЛКМ Расход: г/м 2 при нанесении Срок хранения: 12 месяцев. (Краска может храниться в помещении с температурой окружающей среды.) Рекомендации по применению. Силикатные краски наносятся на поверхность кистью, валиком или распылителем. Нижний предел температуры при нанесении краски -3 С. Рабочий инструмент после использования можно отмыть водой. Известковые краски содержат в качестве связующего гашеную известь. Краска обладает высокой паропроницаемостью, и в некоторых случаях она представляет собой единственный вариант для покрытия старой наружной известковой штукатурки, т. к. позволяет старым стенам «дышать». В настоящее время известковая краска изготавливается только по спецзаказам. К традиционному ассортименту фасадных материалов АО «СКиМ» относятся перхлорвиниловые краски ХВ-161С (ТУ ) и ХВ-182 (ТУ ), защищающие поверхности фасадов от атмосферного воздействия в неблагоприятных условиях промышленных городов. Они применяются для окрашивания оштукатуренных, бетонных, кирпичных, асбоцементных поверхностей. Загустевшие краски разводят ксилолом, сольвентом или бутилацетатом. В зимнее время окрасочные работы можно производить при температуре не ниже -15 С. Время высыхания: ХВ-161С не более 4 часов, ХВ-182 не более 8 часов. Расход: ХВ-161С г/м 2, ХВ г/м 2. Срок хранения: 6 месяцев. Краска ХВ-182 обладает улучшенными физико-механическими (прекрасной адгезией к подложке, эластичностью, стойкостью к ударным нагрузкам) и технологическими (седиментационной устойчивостью) свойствами. В Москве ее использовали при окраске фасадов Большого Кремлевского дворца, Арсенала, Дома союзов, домов на Смоленском бульваре, Маросейке и др. Эмали кремнийорганические КО-168С (ТУ ) предназначены для нанесения защитных и декоративных покрытий на строительные основания и загрунтованные металлические поверхности. Образуют глянцевое покрытие, обладающее высокой стойкостью к статическому воздействию воды. Время высыхания: не более 24 часов при температуре 20 С. Расход: не более 400 г/м 2 при нанесении Срок хранения: 12 месяцев. Рекомендации по применению. Эмали КО-168С наносятся на поверхность кистью, валиком или пневмораспылением. До необходимой вязкости разбавляют ксилолом или сольвентом. Фасадная краска «СКиМ» (ТУ ) является модификацией кремнийорганической краски. Изготавливается на основе кремнийорганического связующего, модифицированного акриловым сополимером, чем обеспечивается необходимое сочетание паропроницаемости и водостойкости у образуемого ею матового покрытия. Краска технологична, обладает высокими защитными и декоративными свойствами. Хорошо совместима со старыми покрытиями разных типов. На окрашиваемую поверхность наносится традиционными способами, в т. ч. при отрицательных температурах, без значительного повышения вязкости, что позволяет обходиться без дополнительного введения растворителей. При необходимости разбавляется уайт-спиритом. Расход: не более 500 г/м 2 при нанесении

4 АО «СКиМ» 133 Рост промышленного производства сборных бетонных строительных конструкций и увеличение объемов ремонтных и реставрационных работ, а также появление на российском рынке импортных фасадных красок послужили толчком для организации на заводе производства красок на основе акриловых связующих. Фасадная краска «Акриал» (ТУ ) имеет высокие физико-механические и эксплуатационные свойства, хорошо «ложится» на фасады, ранее окрашенные импортными и отечественными составами на основе перхлорвиниловых, кремнийорганических смол и составами на основе жидкого калийного стекла. Предназначена для декоративной и защитной отделки бетонных, оштукатуренных, кирпичных и асбоцементных поверхностей. Краска технологична, при нанесении образует матовое эластичное покрытие с высокой адгезией, прекрасными декоративными характеристиками. Имеет улучшенные экологические показатели. Характеризуется отличной паропроницаемостью мг/см 2 в сутки. Это значит, что образуемое ею покрытие «дышит» и, стало быть, краску можно использовать при реставрации уникальных зданий и сооружений. В Москве ею окрашены фасады зданий Малого театра, универмага «Московский», старого здания МГУ, здание Таможни, а также целый ряд домов на центральных улицах столицы. В связи с тем, что краску «Акриал» можно наносить на влажные и теплые поверхности, в т. ч. на твердеющий бетон, она нашла широкое применение на конвейерах московских домостроительных комбинатов ДСК-2, ДСК-3, а ДСК-4 использует ее при окраске изделий непосредственно на строительных площадках. Впрочем, география поставок этой краски значительно шире границ Москвы: «Акриал» поставляется во все регионы России. Растворитель: уайт-спирит, содержание которого в краске составляет 20 25% (по массе). Расход: не более 500 г/м 2 при нанесении Срок хранения: 6 месяцев. Фасадная краска «Акриал-Ц» (ТУ ) предназначена для отделки и защиты цоколей фасадов зданий, окрашивания в помещениях с повышенной влажностью, а также для покраски подземных сооружений, тоннелей, гаражей. По атмосферостойкости она не уступает краске «Акриал». Работать с ней можно даже при отрицательных температурах (по необледенелой поверхности). Образуемое этой краской покрытие отличается повышенной механической прочностью, причем твердость его под действием влажности и времени только увеличивается. Расход: не более 500 г/м 2 при нанесении Гарантийный срок хранения: 4 месяца. Рекомендации по применению. Краска «Акриал-Ц» выпускается готовой к применению. На поверхность наносится кистью, валиком или краскораспылителем. При необходимости ее можно разбавить уайт-спиритом. Фасадная краска «СКиМ-ИНТЕ- КО-850» (ТУ ) предназначена для наружной и внутренней отделки зданий и сооружений. Кроме свойств, присущих краске «Акриал», обладает повышенными водоотталкивающими свойствами. Тиксотропность краски обеспечивает однородность покрытий, отсутствие подтеков при ее нанесении, равномерность толщины покрытия, а также отсутствие осадка при хранении. Покрытия на основе «СКиМ-ИНТЕ- КО-850» остаются чистыми дольше, чем покрытия на основе других красок, что является немаловажным фактором в условиях промышленного города.

5 134 ОТЕЧЕСТВЕННЫЕ ПРОИЗВОДИТЕЛИ ЛКМ Срок хранения: 6 месяцев. Органорастворимые фасадные краски ХВ-161С, ХВ-182, «Акриал», «Акриал- Ц», «СКиМ», «СКиМ-ИНТЕКО-850» выпускаются разных цветов (по желанию заказчика). Рекомендации по применению. Все вышеперечисленные краски можно применять в зимнее и летнее время года для окраски бетонных, оштукатуренных, кирпичных, асбоцементных и других поверхностей. Краски наносятся валиком, кистью, краскораспылителем на подготовленные основания. Новые бетонные и оштукатуренные поверхности необходимо предварительно очистить стальной щеткой от загрязнений, посторонних включений и солей. Цементный клей и масла от литейных форм удаляются пескоструйной обработкой, соли на кирпичной кладке раствором кислот. При повторной окраске известковые и силикатные покрытия удаляются механическим способом с дальнейшей промывкой водой. Старые слои органических лакокрасочных материалов также удаляются механическим способом. (Для удаления старой краски со штукатурки, слабо выдерживающей механические нагрузки, лучше прибегнуть к химическим средствам.) Если произведено уже несколько ремонтов, и в лакокрасочном покрытии обнаруживаются растрескивания, отслоения, трещины, желательно полностью удалить старую краску, а также слабо держащиеся, хрупкие штукатурки или слои бетона. Раскрытые трещины, углубления, впадины на бетонной поверхности необходимо сгладить, а оштукатуренные поверхности в зависимости от плотности выровнять известковым или известково-цементным раствором. Учитывая выросшие экологические требования к безопасности лакокрасочной продукции для окружающей среды, АО «СКиМ» выпускает водно-дисперсионные краски для наружных и внутренних работ, которые могут быть использованы для окраски бетонных, кирпичных, оштукатуренных и деревянных поверхностей. Водно-дисперсионная акриловая краска ВДА-Н (ТУ ) хорошо совмещается с покрытиями на основе акриловых, перхлорвиниловых и силикатных связующих, чем обеспечивается широкий фронт отделочных работ, в которых она находит применение. Краска разбавляется водой. Хорошо колеруется водными пастами. Образует глянцевое покрытие со следующими характеристиками: водостойкость не менее 48 часов, смываемость 0,4 0,8 г/м 2, рн 8 9 ед. Расход: не более 350 г/м 2 при нанесении Срок хранения: 6 месяцев. Рекомендации по применению. Краска ВДА-Н наносится валиком, кистью или пневмораспылителем. При этом температура окружающей среды должна быть не ниже 5 С. Водно-дисперсионная акриловая краска ВДА-Н «Люкс» (ТУ ) предназначена для наружной и внутренней окраски столярных изделий. Это экологически чистая краска белого цвета (по заказу выпускается ВДА-Н «Люкс» разных цветов), которая обладает отличной растекаемостью и образует после высыхания ровное, однородное, полуглянцевое покрытие с шелковистой поверхностью. Покрытие обладает повышенной водостойкостью. Время высыхания: не более 2 часов при температуре (20±2) С. Расход: г/м 2 при нанесении Гарантийный срок хранения: 6 месяцев. Рекомендации по применению. Краска ВДА-Н «Люкс» наносится валиком или кистью, а также воздушным и безвоздушным распылением. Перед окраской поверхность изделия рекомендуется прогрунтовать грунтовкой «ВД- Акрил». Работы следует производить при температуре не ниже 10 С. Для дачного и коттеджного строительства фирма выпускает тонирующий состав «Текстол» (ТУ

6 АО «СКиМ» ), предназначенный для защитной и декоративной отделки древесины под ценные породы дерева. Состав хорошо впитывается, обладает антисептическими и гидрофобными свойствами. Наносится тампоном, кистью, пневмораспылителем на чистую, хорошо подготовленную поверхность. Время высыхания: 2 3 часа. Расход: г/м 2 в зависимости от плотности древесины. Для фасадов вода один из наиболее разрушительных факторов, поэтому гидроизоляции зданий уделяется особое внимание. Для гидроизоляции стыков между наружными панелями в конструкции вновь строящихся и ремонтируемых зданий АО «СКиМ» выпускает двухкомпонентную герметизирующую уретановую мастику «Эпур» (ТУ ). После отверждения она обладает высокой стойкостью к температурным деформациям и вибрационным воздействиям, а также к действию агрессивных атмосферных факторов. Кроме того, эта мастика характеризуется отличной адгезией к бетону, дереву, металлу. Цвет: основной белый; по требованию потребителя любой. Жизнеспособность: не менее 2 часов после смешивания компонентов. Расход: г/п. м при ширине полосы 20 мм и толщине слоя 2 мм. Фасовка: полиэтиленовая тара по 20 кг. Гарантийный срок хранения: 6 месяцев. Рекомендации по применению. Мастика «Эпур» наносится на поверхность стыка (как на сухую, так и на мокрую) слоем толщиной 1 3 мм при помощи шпателя, шприца или другого приспособления. Работы можно производить при температуре от -10 до +30 С. Дальнейшая эксплуатация возможна в диапазоне температур от -50 до +70 С. Это позволяет использовать мастику практически во всех климатических зонах России. 135 Для приклеивания рулонных, плиточных декоративных поливинилхлоридных материалов, а также паркета к различным поверхностям полов и стен внутри жилых и общественных зданий АО «СКиМ» выпускает клей дисперсионный АДМ-К и мастику клеящую «Перменид», которые образуют водостойкий клеевой слой и обеспечивают ему высокую прочность на отрыв. Мастика клеевая «Перменид» (ТУ ) выпускается готовой к применению. При необходимости разводится ацетоном, бутилацетатом или этилацетатом. Наносится на поверхность зубчатым шпателем с образованием ровного слоя толщиной 0,1 0,5 мм. Работы с мастикой можно производить как при положительных, так и отрицательных температурах. Расход: при приклеивании линолеума г/м 2, паркета г/м 2. Гарантийных срок хранения: 6 месяцев. Клей дисперсионный АДМ-К (ТУ ) тоже выпускается готовым к применению. При необходимости разбавляется водой. На подложку наносится зубчатым шпателем, кистью или поролоновым валиком с образованием ровного слоя толщиной 0,2 0,3 мм. Работы с клеем можно производить при температуре не ниже 5 С. Расход: г/м 2. Срок хранения: 6 месяцев при температуре не ниже 5 С. Вся продукция, выпускаемая АО «СКиМ», имеет сертификат качества, гигиенический сертификат и сертификат соответствия. Использование линий фирмы Oliverbettl позволяет расфасовывать лакокрасочную продукцию в емкости по 2, 3, 5, 10, 20, 50, 100 и 200 л. Как показывает накопленный предприятием опыт проведения ремонтов и обновления фасадов, долговечность покрытий, их эксплуатационные свойства

7 136 ОТЕЧЕСТВЕННЫЕ ПРОИЗВОДИТЕЛИ ЛКМ в огромной мере зависят от качества подготовки поверхности и правильного выбора комплекса лакокрасочных материалов. Предлагаемый АО «СКиМ» комплекс (ТУ ) состоит из материалов для подготовки поверхности под окраску и ее окончательной отделки. Для каждого вида пленкообразующего предусмотрен определенный набор материалов. Комплекс материалов для подготовительных работ и отделки фасадов (Рекомендуется для новых и ранее окрашенных бетонных, оштукатуренных, кирпичных, асбоцементных поверхностей.) Перхлорвиниловые материалы: упрочняющий состав ХВ-АК; грунтовка ПХВ; шпатлевка ПХВ; краски ХВ-161С (ТУ ), ХВ-182 (ТУ ). Акриловые органорастворимые материалы: упрочняющий состав ХВ-АК; грунтовка «Акрил»; шпатлевка «Акрил»; краски «Акриал», «Акриал-Ц» (ТУ ), «СКиМ» (ТУ ). Водно-дисперсионные акриловые материалы для наружных работ: упрочняющий состав «ВД-Акрил»; грунтовка «ВД-Акрил»; шпатлевка «ВД-Акрил»; краска ВДА-Н (ТУ ) и ВДА-Н «Люкс» (ТУ ). Упрочняющие составы применяются для укрепления непрочного рыхлого слоя поверхности путем ее пропитки, а также связывания солей, образующихся в основании подложки. При этом они не закрывают пор, что позволяет материалам «дышать». Состав ХВ-АК представляет собой прозрачную, слегка замутненную жидкость. На поверхность наносится кистью. Время высыхания: 4 8 часов в зависимости от плотности поверхности. Расход: г/м 2. Состав «ВД-Акрил» представляет собой жидкость молочно-белого цвета. На поверхность наносится кистью. При этом температура окружающей среды должна быть не ниже -5 С. Время высыхания: 2 5 часов в зависимости от прочности поверхностного слоя. Расход: г/м 2. Грунтовочные составы применяются для пропитки и связывания поверхностных слоев подложки и обеспечения адгезии с последующим слоем. ПХВ-грунтовку можно наносить на подложку валиком, кистью, пневмораспылителем, в т. ч. при отрицательных температурах. Адгезия грунтовочного покрытия к окрашиваемой поверхности не более 2 баллов (по 5-балльной системе). Время высыхания: не более 4 часов при температуре 20 С. Расход: г/м 2. «Акрил»-грунтовка образует эластичное покрытие с высокой адгезией к подложке (1 балл). Наносится кистью, валиком, пневмораспылителем. Может применяться при отрицательных температурах (до -15 С). Время высыхания: часов. Расход: г/м 2. Шпатлевочные составы применяются для выравнивания раковин, трещин, сколов на поверхности. ПХВ-шпатлевка представляет собой однородную пастообразную массу. Выпускается готовой к применению. Обладает высокой стойкостью к статическому воздействию воды (не менее 24 часов). Наносится шпателем в один или несколько слоев в зависимости от глубины раковин. Время высыхания: 8 10 часов при толщине шпатлевочного слоя 2 мм.

8 АО «СКиМ» «Акрил»-шпатлевка представляет собой однородную пастообразную массу с высоким содержанием нелетучих веществ (более 75%), что указывает на небольшую усадку шпатлевочного слоя. Технологична, легко наносится, тиксотропна (не образует подтеков при нанесении на вертикальную поверхность). Может применяться при отрицательных температурах. Шпатлевочное покрытие имеет высокую адгезию к основанию и отличается стойкостью к статическому воздействию воды. Время высыхания: 8 10 часов при толщине шпатлевочного слоя 2 мм. Шпатлевка «ВД-Акрил» представляет собой однородную пастообразную массу, которая технологична при нанесении, не стекает с вертикальной поверхности. Даже при выдерживании в воде в течение 24 часов в шпатлевочном покрытии не наблюдается отмешивания, вспучивания и снижения адгезии к подложке. При проведении работ со шпатлевкой температура окружающей среды должна быть не ниже 5 С. Время высыхания: часов. Материалы специального назначения Для защиты металлических поверхностей от коррозии предприятие выпускает эпоксидную грунтовку ЭП «Инкор» (ТУ ) и грунт-эмаль «Унигрэм» (ТУ ). Они предназначены для огрунтовки и самостоятельной защиты прокорродировавших поверхностей черных металлов (при толщине слоя продуктов коррозии до 100 мкм), подвергающихся воздействию промышленной атмосферы, содержащей агрессивные газы и пары, кратковременному обливу кислотами и щелочами, воздействию климатических факторов, 137 повышенной температуры (до 1000 С) и влажности. Время высыхания: не более 24 часов при температуре (20±2) С. Расход: ЭП-0199 «Инкор» г/м 2, «Унигрэм» г/м 2 при нанесении в один слой. Рекомендации по применению. Поверхность необходимо обезжирить, очистить от рыхлой ржавчины с помощью металлической щетки. Грунтовку ЭП-0199 «Инкор» или грунт-эмаль «Унигрэм» наносят краскораспылителем или кистью. После смешивания с отвердителем состав необходимо использовать в течение, максимум, 8 часов. Грунтовка ГФ-021 (ГОСТ ) предназначена для грунтования металлических и деревянных поверхностей под покрытия различными лакокрасочными материалами. Время высыхания: не более 24 часов при температуре окружающего воздуха (20±2) С. Расход: г/м 2 при нанесении в один слой. Рекомендации по применению. Грунтовка ГФ-021 наносится краскораспылителем или кистью на сухую, очищенную от ржавчины поверхность. Грунтовка акриловая водно-дисперсионная «ВД-Акрил» (ТУ ) предназначена для огрунтовки столярных изделий под краску ВДА-Н «Люкс». Время высыхания: не более 1,5 часа при температуре 20 С. Расход: г/м 2. Гарантийный срок хранения: 6 месяцев. Рекомендации по применению. Перед употреблением грунтовку «ВД-Акрил» надо перемешивать, отфильтровать и разбавить водой в соотношении 1:1 (по объему). На поверхность изделия ее наносят пневмораспылением, струйным обливом, окунанием, а также с помощью валика или кисти. Работы грунтовки следует производить при температуре не ниже 10 С.

9 138 ОТЕЧЕСТВЕННЫЕ ПРОИЗВОДИТЕЛИ ЛКМ Алкидная шпатлевка ПФ-002 (ГОСТ ) предназначена для выравнивания и исправления дефектов загрунтованных металлических и деревянных поверхностей, эксплуатируемых снаружи и внутри помещений. Выпускается готовой к применению. Может применяться при отрицательной температуре окружающего воздуха. На поверхность наносится шпателем. Цвет: красно-коричневый. Время высыхания: не более 24 часов при температуре (20±2) С. Расход: до 1000 г/м 2 в зависимости от толщины слоя. Краска «Акродор» (ТУ ) предназначена для нанесения дорожной разметки на твердые покрытия автомобильных дорог. Это быстровысыхающая, атмосферостойкая краска, стойкая к истиранию, воздействию горючесмазочных материалов, противообледенительных препаратов. Образуемое ею покрытие устойчиво к перепадам температуры от -30 до +50 С и воздействию рабочих органов грязе- и снегоуборочной дорожной техники. Для получения высокого эффекта светоотражения может быть использована в комплекте со светоотражающими стеклошариками. Время высыхания: до начала движения не более 30 минут при толщине красочной пленки до 150 мкм и температуре окружающей среды (20±2) С; до начала использования дорожной техники 24 часа при температуре не ниже 20 С. Расход: г/м 2. Фасовка: металлические бидоны по 48 л; другая тара по согласованию с потребителем. Гарантийный срок хранения: 6 месяцев, в т. ч. на открытом воздухе. Рекомендации по применению. Перед употреблением краску «Акродор» следует тщательно перемешать, при необходимости разбавить растворителем Р-4 (допускается также применение толуола). Дорожное покрытие должно быть чистым, сухим, без пыли. Краска наносится кистью, пневматическим или безвоздушным распылением.

Изменения, которые вносятся в государственные сметные нормативы. Федеральные единичные расценки на строительные и специальные строительные работы (ФЕР-2001) ФЕР 81-02-2001-И8 (утв. приказом Министерства регионального развития РФ от 29 июня 2012 г. N 262)

В Федеральные единичные расценки на строительные и специальные строительные работы «I. Общие положения» внести следующие изменения и дополнения:

Пункт 1.46.7 изложить в следующей редакции:

1.46.7. Расценками таблиц 46-03-001, 46-03-002 на сверление отверстий в железобетонных конструкциях установками алмазного бурения предусмотрено сверление вертикальных отверстий глубиной до 1000 мм, горизонтальных — до 1700 мм независимо от класса и диаметра арматуры.

Дополнить раздел «I. Общие положения» пунктами 1.27.47, 1.27.48, 1.33.37, 1.46.34, 1.46.35, 1.46.36:

1.27.47. В расценках 1-8 таблицы 27-11-012 учтен расход грунта в уплотненном состоянии,

1.27.48. Расценками 1-3 таблицы 27-11-012 предусмотрено выполнение работ по укладке грунтовых модулей для сооружения проездов, дорог, насыпных площадок. При установке грунтовых модулей на откосах к нормам затрат труда и эксплуатации строительных машин следует применять коэффициент 1,1.

1.33.37. В расценках таблиц 33-01-058, 33-01-059, 33-01-060 не учтены и должны учитываться дополнительно затраты по переустройству пересекаемых объектов (воздушных линий, линий контактной сети).

1.46.34. В расценках таблицы 46-08-003 расход составляющих компонентов для приготовления 1 составов определяется исходя из марки сухой смеси и производственных норм расхода компонентов.

1.46.35. В расценках таблиц 46-08-004, 46-08-005, 46-08-006, 46-08-007, 46-08-009, 46-08-010, 46-08-011, 46-08-012 не учтены и должны учитываться дополнительно затраты по подготовке ремонтируемой поверхности перед нанесением ремонтных составов.

1.46.36. В расценках таблиц 46-08-004, 46-08-005, 46-08-006, 46-08-007, 46-08-009, 46-08-010, 46-08-011, 46-08-012 не учтены затраты на приготовление ремонтных смесей, их следует определять дополнительно по таблице 46-08-003.

В Федеральные единичные расценки на строительные и специальные строительные работы внести следующие изменения и дополнения:

Раздел 3. Трубопроводы из многослойных металлополимерных труб

В раздел «IV. Приложения» внести следующие изменения и дополнения:

Замены по расценкам 16-04-001-01, 16-04-001-02 изложить в следующей редакции:

Приложение 16.2

Таблица замены ресурсов ФЕР части 16

Замены по расценкам 27-06-020-01, 27-06-020-02 изложить в следующей редакции:

Приложение 27.4

Таблица замены ресурсов ФЕР части 27

Приложение 27.4 дополнить заменами по расценке 27-06-052-01:

Приложение 27.4

Таблица замены ресурсов ФЕР части 27

Приложение 33.3 изложить в следующей редакции:

Приложение 33.3

Коэффициенты к расценкам, учитывающие условия применения ФЕР части 33 разделов 1-3

При изменении технических решений
При производстве работ в усложненных условиях

Примечания:

1. К болотам и заболоченным землям (п. 3.11) отнесены участки с избыточно увлажненной поверхностью, покрытой слоем торфа.

2. Коэффициенты для горных условий, крутых склонов (косогоров) и оврагов (п. 3.13) применяются при средних уклонах более 1:5 в любом направлении. Для монтажа проводов и грозозащитных тросов эти коэффициенты применяются только при длине уклона не менее одного расчетного пролета или в пределах уступа.

Приложение 33.6 дополнить заменами по расценкам 33-01-058-01; 33-01-058-02; 33-01-058-03; 33-01-058-04; 33-01-058-05; 33-01-058-06; 33-01-058-07; 33-01-058-08; 33-01-058-09; 33-01-058-10; 33-01-058-11; 33-01-058-12; 33-01-058-13; 33-01-058-14; 33-01-058-15; 33-01-058-16; 33-01-059-01; 33-01-059-02; 33-01-059-03; 33-01-059-04; 33-01-059-05; 33-01-059-06; 33-01-059-07; 33-01-059-08; 33-01-059-09; 33-01-059-10; 33-01-059-11; 33-01-059-12:

Приложение 33.6

Таблица замены ресурсов ФЕР части 33

Сметные расценки на эксплуатацию строительных машин и механизмов 122006 изложить в следующей редакции:

Приложение 50

Сметные расценки на эксплуатацию строительных машин и механизмов в базисных ценах по состоянию на 01.01.2000 г.

Сметные расценки на эксплуатацию строительных машин и механизмов дополнить следующими ресурсами:

Сметные расценки на эксплуатацию строительных машин и механизмов в базисных ценах по состоянию на 01.01.2000 г.

Характеристики универсальной грунтовки, состав, виды

Грунтование оснований, независимо от типа поверхности и ее расположения – неотъемлемый этап любых ремонтных работ. Технические характеристики универсальной грунтовки делают ее максимально подходящей для обработки любого типа поверхностей. Она призвана выполнять сразу несколько функций, присущих специализированным составам.

Особенности и свойства универсальной грунтовки

Предназначается она для подготовки оснований к финишной отделке. Состав грунтовки универсальной способствует повышению эксплуатационных параметров поверхности.

Состав

Смесь для грунтования поверхностей содержит:

  1. пленкообразующие агенты;
  2. пластификаторы;
  3. модифицирующие добавки;
  4. антисептические компоненты;
  5. вещества, ускоряющие впитывание и полимеризацию грунтовки;
  6. окрасочные пигменты.

Назначение

Грунтовка универсальная призвана одновременно выполнять множество функций:

  1. Укреплять поверхность, предотвращая ее осыпание, крошение или меление;
  2. Упрочнять основание, делая его монолитным и надежным;
  3. Способствовать повышению водоотталкивающих характеристик поверхности;
  4. Улучшать сцепление основания с последующей отделкой;
  5. Обеспечивать равномерность и легкость нанесения шпаклевки, штукатурки или лкм;
  6. Защищать стены от образования плесени;
  7. Выравнивать впитывающую способность;
  8. Экономить материалы, используемые для декоративной или финишной отделки;
  9. Ускоряет отвердевание шпаклевочных слоев;
  10. Увеличивать эксплуатационный срок декоративной отделки.

Виды

Состав может производиться в двух разновидностях:

  1. Грунтовка универсальная акриловая, содержащая акриловые полимеры;
  2. Грунтовка глубокая универсальная, используемая для максимально глубокой пропитки основания.

Также сегодня можно встретить и латексный универсальный состав, и антикоррозийный.

Применение

Сфера применения грунта достаточно обширна, что и делает его универсальным:

  • бетонные основания;
  • металлические;
  • деревянные;
  • пеноблоковые;
  • газобетонные;
  • древесноволокнистые;
  • древесностружечные;
  • кирпичные;
  • оштукатуренные;
  • каменные;
  • гипсокартонные;
  • гипсоволокнистые.

Не исключениями являются поверхности из известняка или гипса, газосиликатных и цементно-песчаных материалов.

Технические характеристики универсальной грунтовки

Характеристики Единица измерения Значение показателя
Температурный режим °С  +5…+30
Приблизительная площадь нанесения 1 слоя (10 л.) м² 65
Время полимеризации 1 слоя мин. 30-90
Варианты фасовки л 0,9; 2,5; 5; 10 и т. д.
Срок хранения мес 6
Температура хранения °С от +5 до +50

Расход грунтовки универсальной в среднем равен 0,15 кг/м2. В первую очередь он зависит от типа основания и его пористости, а также количества слоев.

Средняя цена колеблется в пределах от 280 до 700 р. за 10 л.

Преимущества грунта

Грунтовка универсальная – состав, наделенный множеством преимуществ, присущих каждому виду специализированных грунтовок в отдельности.

Сначала стоит отметить уникальные адгезионные качества грунта за счет образования тончайшей пленки, играющей роль своеобразного магнита, буквально притягивающего наносимый отделочный материал. Это обеспечивает не только долговечность, но и привлекательность декоративной отделки.

Вдобавок, пленка, образуемая после полимеризации жидкости, повышает влагостойкость основания, что говорит о возможности применения состава для обработки как сухих, так и влажных помещений. А хорошая паропроницаемость не создает воздухонепроницаемого барьера.

Состав грунтовки универсальной также известен своими проникающими и укрепляющими свойствами. Проникая вглубь поверхности, грунт склеивает все отслаивающиеся и осыпающиеся частички поверхности и делает ее цельной и монолитной.

Иными словами говоря, основание становится прочным и надежным. Оно обретает однородную, плотную структуру. Особенно хорошо справляется с этой целью грунтовка глубокая универсальная, славящаяся своими проникающими качествами.

Покраска универсальной грунтовкой – простой процесс, что позволяет с легкостью справиться с задачей, имея в арсенале валики и несколько кистей. А быстрая полимеризация грунта ускоряет ремонтные работы в целом.

Этому способствует также безупречная эластичность состава, благодаря которой грунт отлично укрывает как относительно гладкие металлические и бетонные, так и сложные деревянные, кирпичные или каменные поверхности.

Ведь именно тип поверхности и определяет расход грунтовки универсальной. Кроме того, эластичность позволяет наносить грунт равномерно.

И грунтовка универсальная акриловая, и глубоко проникающая – экологичные, пожаростойкие и нетоксичные, поэтому их применение при внутренней отделке совершенно безопасно.

Помимо этого, грунтовка универсальная, цена которой достаточно приемлема, очень экономно расходуется, снижая при этом расход финишных отделочных материалов.

Среди недостатков стоит отметить лишь то, что хотя универсальная грунтовка и призвана решить несколько задач одновременно, однако она все же уступает по эффективности специализированным составам, разработанным для основательного решения той или иной проблемы с основанием.

Производители универсальной грунтовки

Сегодня грунтовка универсальная выпускается многими известными на рынке отделочных материалов производителями. Ценовая политика, установленная на продукцию, регулируется изготовителем.

Наиболее популярные и качественные универсальные грунты:

Грунтовка Bergauf

Совместное отечественно-германское производство позволило получить уникально качественный и профессиональный состав. Продукция сертифицируется в соответствии с европейскими стандартами качества и безопасности.

Грунтовка Beckers

Выпускается от имени скандинавской компании, признанной лидером в своей сфере. Эффективность скандинавских грунтов подтверждена научным и опытным путем. Пригодны они для обработки всех типов оснований.

Грунтовка Ceresit

Торговая марка принадлежит одному из крупнейших немецких заводов Henkel. Почти 150-летний опыт компании позволяет получать необычайно качественный грунт, расходуемый весьма экономно.

Грунтовка Unis

Один из лучших составов российского производства. Популярен не только в пределах РФ, но и в странах СНГ. Привлекает качественными характеристиками и продолжительной жизнеспособностью раствора.

Не меньший интерес для отечественного потребителя вызывает грунтовка Основит и Лакра. Имея достаточно низкую стоимость, растворы отличаются безупречными эксплуатационными параметрами.

Свойства и характеристики универсальной грунтовки делают ее поистине уникальной. Высококачественный набор компонентов позволил получить необычайно функциональный состав, придающий поверхности оптимальную прочность, влагостойкость и износоустойчивость.

Характеристики универсальной грунтовки, видео

5. АЛФАВИТНЫЙ УКАЗАТЕЛЬ ВЫПУСКАЕМОЙ …

<strong>5.</strong> АЛФАВИТНЫЙ УКАЗАТЕЛЬ ВЫПУСКАЕМОЙ ПРОДУКЦИИ 0-9 • 1,2-дибромпропан 2006 • 1,2-дибромпропан сорт 1 1531 • 1,2-дибромпропан сорт высший 1531 • 1,3-диоксан 1410 • 1,4-диметилпиперазин 1933 • 1,4-дихлорбензол технический 1165 • 1-амино-2-4 дибромантрахинон 1990 • 1-амино-2-бром-4-оксиантрахинон 1990 • 1-аминоантрахинон 1990 • 1-бромнафталин 2006 • 1-хлор-3-бромпропан 1531 • 2,2-азоизобутиронитрил 1789 • 2,4-динитротоул 1986 • 2,4-динитрофенол 1386 • 2,4-динитрохлорбензол 1386, 1386 • 2,4-дихлорфеноксиуксусная кислота 1161 • 2,5-дихлорнитробензол технический 1386 • 2,6-дихлор-4-нитроанилин технический 1990 • 2-амино-4,6-динитрофенол (кислота пикраминовая) 1386 • 2-амино-анизол технический 1990 • 2-аминоантрахинон 1990 • 2-меркаптобензтиазол гранулированный ГОСТ 739-74 1003 • 2-метилбензотиазол 1841 • 2-нафтол 1990 • 2-нафтол (2-оксинафталин) ГОСТ 923-80 1003 • 2-хлорнитробензол-5-сульфокислоты натриевая соль техническая 2009 • 2-этилгексанол 1361, 1493, 1496, 1506 • 2-этоксиэтанол Ч 1072 • 3,5-динитро-о-толуиловой кислоты 1072 • 3,5-динитробензойная кислота 1986 • 3,5-метилпиразол 1998 • 4-4`-диаминодифениловый эфир (4,4`-оксидианилин) 1990 • 4-бета-оксиэтилсульфанил-2-аминоанизол сернокислый эфир 1921 • 4-бета-оксиэтилсульфанил-анилин сернокислый эфир 1921 • 4-гидрокси-4-бифенилкарбонитрил 1789 • 4-толуидин-3-сульфонат натрия технический ТУ 6-14-334-85 1091 • 4-хлорнитробензол-3-сульфокислоты натриевая соль техническая 2009 • 5,5-диметилгидантоин 1767 • 5-бром-2-индолиндион (5-бромизатин) 1990 • 8-оксихинолят меди 1990 A-Z • br-1`-бромбензантрон (3-бромбензантрон) 1990 • br-1`6-дибромбензантрон 1990 • n’,n’ – диотиодиморфолин активный гранулированный 1921 • n-броманила гидрохлорид Ч 1876 • N-метиланилин технический ТУ 2471-269-00204168-96 1003 • N-нитрозодифениламин 421 • n-нитрозодифениламин технический 1206 • n-третбутилфенол ТУ 2425-438-05742686-99 1195 • n-фенолсульфокислота (50% водный раствор) 1789 • n-цетилпиридиния хлорида моногидрат 1789 • pH-метр ПМП-112 1402 • pH-метр ПМП-132 1402 • pH-метр ПМП-221Б 1402 • pH-метр ПМП-221Т 1402 • pH-метр ПМП-232 1402 • pH-метры 1402 • абсорбент «Новопром» 1066 • абсорбент «Новопром-1» 1066 • абсорбент «Новопром-2» 1066 • абсорбент марка А-1 1066, 1495 • абсорбент марка А-2 1066, 1495 А • абсорбент марка А-2 тяжелый ТУ 38,3039-88 1122 • абсорбент марка А-3 1066 • абсорбент Н марка Б 1066 • абсорбент осветленный стабилизированный ТУ 2411-418-05742686-98 1195 • авто-, мото-, велоаптечки 1520 • автоантикор БМК 1043 • автоантикор М-14 1043 • автогерметик эпоксидный универсальный 1165 • автожидкость охлаждающая «Вид» 771 • автожидкость охлаждающая «Лена» 1087, 1320 • автожидкость охлаждающая «Лена-40» 1320 • автожидкость охлаждающая «Лена-65» 1320 • автожидкость охлаждающая «Север-40М» 1367 • автожидкость охлаждающая «Тосол ОИЗ» 1320 • автожидкость охлаждающая ПОЖ-70 1320 • автожидкость тормозная БСК 806 • автозапчасти 1097 • автозапчасти из пластмасс 1291 • автозапчасти резиновые для легковых автомашин 1911 • автокамера 12,00-20 1529 • автокамера 13,6-38 1529 • автокамера 14,00-20 1529 • автокамера 6,15-6,45-13 УК13М 1529 • автокамера 6,95-16 1529 • автокамера 7,35-14 1529 • автокамера 8,25-20 1529 • автокамера 9,00-16 1529 • автокамера 9,00-20 1529 • автокамеры 135-12 613 • автокамеры 8,40-15 613 • автокамеры сверхкомплектные 1069 • автокамеры сверхкомплектные 10,00-20 1069 • автокамеры сверхкомплектные 11,00-20 1069 • автокамеры сверхкомплектные 11,2-20 1069 • автокамеры сверхкомплектные 12,00-16 1069 • автокамеры сверхкомплектные 12,00-20 1069 • автокамеры сверхкомплектные 1220-400-533 1069 • автокамеры сверхкомплектные 13,6-38 1069 • автокамеры сверхкомплектные 135/80-12 1069 • автокамеры сверхкомплектные 14,00-20 1069 • автокамеры сверхкомплектные 155/165-13 1069 • автокамеры сверхкомплектные 16,5-18 1069 • автокамеры сверхкомплектные 175-16 1069 • автокамеры сверхкомплектные 18,4-24 1069 • автокамеры сверхкомплектные 185-15 1069 • автокамеры сверхкомплектные 205-14 1069 • автокамеры сверхкомплектные 21,3-24 1069 • автокамеры сверхкомплектные 6,5-16 1069 • автокамеры сверхкомплектные 6,50-13 1069 • автокамеры сверхкомплектные 6,95-16 1069 • автокамеры сверхкомплектные 7,50-20 1069 • автокамеры сверхкомплектные 8,15-15 1069 • автокамеры сверхкомплектные 8,25-20 1069 • автокамеры сверхкомплектные 8,40-15 1069 • автокамеры сверхкомплектные 9,00-16 1069 • автокамеры сверхкомплектные 9,00-20 1069 • автокамеры сверхкомплектные УК-13М 1069 • автокамеры сверхкомплектные УК-14М 1069 • автокамеры УК 13,01 613 • автокамеры УК 14М 613 • автокамеры УК-14,02 613 • автоклавы 1478 • автоконсервант «Уникум» ТУ У 00204665-031-95 1871 • автоконсервант ИФХАН-29А 183 • автоконсервант порогов «Акор-1» 490 • автоконсервант порогов «Мовиль» 811, 1371 • автоконсервант порогов «Мовиль» ТУ 2384-011-05744685-96 418 • автоконсервант порогов «Мовиль-2» 648, 1973 • автоконсервант порогов «Мовиль-НН» 1304 • автокосметика 478, 717, 805, 1816 © ЗАО «АСУ-ИМПУЛЬС», 2002 ХИМИЯ И НЕФТЕХИМИЯ: ПРОИЗВОДСТВО И ТОРГОВЛЯ

show all

0,983688 -7,53492 а также
0,58373 -7,53707 и др.
0,449749 -7,96724 на основе
0,790833 -8,13204 будет
0,912485 -8,18256 связанный с
0,888628 -8,24017, а не
0.8091 -8.25847 должно быть
0,636122 -8,3407 по
0,894521 -8,38248 по отношению к
0,704526 -8,38839 может быть
0,717234 -8,54142 в пересчете на
0,6679 -8,5742 машинный перевод
0,4

-8,64426, чтобы
0,926 -8,69197 должно быть
0,614181 -8,86223 больше чем
0,915493 -8,87455 вместе с
0,631166 -8,87948 может быть
0.882222 -8,89289 производное от
0,637312 -8,89405 в этой статье мы
0,473369 -8,93415 сингл
0.988304 -8.94055 полагаться на
0,79845 -8,95723 машинное обучение
0,945504 -8,9575, за которым следует
0,872038 -8,9803 соответствуют
0,643799 -9,00271 нет
0.996785 -9.0182 выполнено
0,664286 -9,02018 испытательный комплект
0,8379 -9,0235 нет
0,788934 -9,03629 соответствует
0,585616 -9,04842 будет
0,85049 -9,06358 именованное лицо
0,865482 -9,06405 наиболее часто
0,9653 -9,06525 хотя бы один
0.868895 -9.07053 и др., 2010)
0.646638 -9.07477 извлечено из
0.964052 -9.10255 позволяет нам
0,571098 -9,10935 &
0,573598 -9,11193 не менее
0,375251 -9,11411 было
0,415249 -9,14063 за счет
0,774336 -9,15114 с другой стороны,
0,768879 -9,19648 меньше чем
0.785024 -9.21184 информация о
0.618759 -9.21868 лучше, чем
0,835655 -9,22914 таблица 4:
0,384388 -9,23146 были
0.873457 -9.24214 производства
0,830861 -9,3034 в зависимости от
0,670588 -9,31709 в дополнение к
0,766234 -9,33093 не может быть
0,610649 -9,33993 золотой стандарт
0.527363 -9,34172 вместо
0,521793 -9,36536 c © 2011 ассоциация компьютерной лингвистики
0,852843 -9,3684 скорее всего будет
0.953975 -9.3712 дело с
0,938525 -9,38251 частота ошибок
0,843854 -9,38551 вместе с
0,57837 -9,38938 цифра 1:
0,813084 -9,3954 наборов данных
0,706161 -9,40248 выравнивание слов
0,952381 -9,40474 другими словами,
0,325207 -9,43583 не
0,835052 -9,43929 тегов pos
0,439163 -9,4404 языковая модель
0,745856 -9,44809 хмм
0,175118 -9,44833 может быть
0,398413 -9,45528 естественный язык
0.870722 -9,45742 разрешение coreference
0,724868 -9,459 приводят к
0,723684 -9,45935 сосредоточено на
0.57596 -9.46027 следующим образом:
0,748588 -9,46207 различные
0,629259 -9,46516 таблица 3:
0,746479 -9,46615 разбор зависимостей
0,875486 -9,46774 пролета
0,844203 -9,46882 14
0,683333 -9,47365 показано на рисунке
0,

5 -9,4763 тоже.
0.80602 -9.48169 мы бы хотели
0,566445 -9,48934 сфокусироваться на
0,493622 -9,49978 применяется к
0,881633 -9,50283 2 связанные работы
0,952153 -9,50542 рисунок 4:
0,795302 -9,51224 выше, чем
0.828467 -9,51313 попытка
0,485607 -9,51343 относится к
0,86166 -9,51486 (например,
0,720222 -9,5178 приводит к
0,883333 -9,52001 предварительная обработка
0,626327 -9,53152 а.
0,789831 -9,53543 большое количество
0,933649 -9,53683 скорее всего
0,592734 -9,53838 набор данных
0,764331 -9,53953 в этом разделе,
0,660333 -9,54046 структурный
0,969072 -9,54767 именованные объекты
0.941463 -9.55007 с ручными аннотациями
0,614108 -9,5507 языковых моделей
0,499314 -9,55088 таблица 1:
0,798587 -9,5562 именная фраза
0,629386 -9,55639 данные обучения.0,6125 -9,55975 генерирующий
0,936275 -9,56381 соотношение между
0,958549 -9,57377 уровень предложения
0,918269 -9,58567 экспериментировал с
0,522621 -9,58766 немецкий
0,859574 -9,5932 мы считаем, что
0,69337 -9,59377 ссылки
0.604211 -9.59547 …
0,785714 -9,59853 мы хотим
0,646489 -9.60209 богатый
0.921182 -9.60223 в отличие от
0.920792 -9.60582 Penn treebank
0,60084 -9.60608 традиционный
0,988506 -9,61601 в зависимости от
0.607843 -9.61974 построить
0,818182 -9,62008 таблица 5:
0,780576 -9,62045 16
0,762069 -9.6228 подмножество
0,479564 -9,62334 для идентификации
0,732484 -9,6256, чтобы избежать
0,

4 -9,63436 18
0.8
-9.63585 посмотрите на
0,760417 -9,63667 тестов
0,935829 -9,65368 относятся к
0,982249 -9,65404 привело к
0,921875 -9,65449 рассматривается как
0,781955 -9,65811 балл по bleu
0,926316 -9,6587 сравнений
0,845815 -9,66266 более сложный
0,855204 -9,66423 в данном случае,
0,944444 -9,66979 широко используется
0,515807 -9,67598 vs.
0,954286 -9,67778 поиск информации
0.804878 -9.68074 (см. Раздел
0,993789 -9,68271 процессов
0.701863 -9,6833 словесный
0,846154 -9,68558 н.
0,485163 -9,68672 наш метод
0,647215 -9,68847 вид
0,948571 -9,68993 навеяны
0,551257 -9,6965 до
0,948276 -9,69799 таблица 6:
0.819742 -9.69848 будущая работа.
0.892857 -9.6996 фокусируется на
0,942857 -9,70094 на практике,
0,88 -9,70674 косинусное подобие
0,300818 -9,70943 набор
0.603774 -9.71106 сгенерировано
0,947674 -9,71149 насколько хорошо
0.769231 -9.71436 доступ к
0,761364 -9,71851 близко к
0.969325 -9.71872 адаптация домена
0,2

-9,71918 нет
0.866337 -9.72808 словосочетаний с существительными
0,818584 -9,73102 полагается на
0,758621 -9,73748 представлены
0,941176 -9,73812 друг друга.
0,49835 -9,73909 для создания
0,405702 -9,74072 моделирование
0,539806 -9,74091 у нас нет
0,762646 -9,74196 разницы между
0.876923 -9.74276 взято из
0,760618 -9,74305 зависит от
0.839623 -9.74571 можно найти
0,798283 -9,75038 диалог акт
0,896739 -9,75091 строительство
0,620779 -9,7512 показали, что
0,555094 -9,75219 несколько
0,476336 -9,75219 см.
0,734545 -9,75346 р.
0,405345 -9.75813 по сравнению с
0.636364 -9.75963 таблица 1.
0,623342 -9,76554 состоящий из
0,733333 -9,77509 изменение рейтинга
0.588942 -9.77882 улучшение
0,815668 -9,77895 21
0,574713 -9,78241 фильтрация
0.56044 -9.78783 рисунок 2:
0,888889 -9,79403 раствора
0.718978 -9.79688 можно увидеть
0,643275 -9,79722 минимальный
0,714801 -9,79933 мы обнаружили, что
0,754032 -9,79966 биграмм
0,926829 -9,8004 Таблица 3 показывает
0,279623 -9,80226 —
0,700348 -9.80299 сглаживание
0,6 -9.80534 может быть
0.440608 -9.80772 проблемы
0,865591 -9,81132 лексикализованный
0.925926 -9,81561 тег pos
0,706093 -9,81683 прошлое
0,895954 -9,8196 состоят из
0,545064 -9,82161 имеют тенденцию к
0,920245 -9,82322 распознавание речи
0,979167 -9,82455 управляемый
0,686007 -9,82501 получено из
0.609164 -9.8258 экспериментальные результаты
0,833333 -9,82706 Таблица 1 показывает
0,648318 -9,82816 отсутствие
0,909639 -9,82931, что приводит к
0,93038 -9,83246 целевая функция
0.333876 -9.8326 часть
0,829146 -9,83387 в результате,
0,636905 -9,83834 обычный
0.77193 -9.8396 возраст
0,992701 -9,84331 логистическая регрессия
0.884393 -9,84556 22
0,69395 -9,8457 тестовый набор.
0,73494 -9,84849 пар фраз
0.541485 -9.85071 синтаксис
0,

-9,8509 разделить на
0,689046 -9,85105 мкм
0,978417 -9,8562 динамическое программирование
0,454264 -9,85971 таблица 2:
0,415803 -9,85971 через
0,856354 -9,86152 17
0,892216 -9,8617 собственное
0,511811 -9,86235 в целом
0,922581 -9,86463 реальный мир
0,877907 -9,86552 мы видим, что
0,728 -9,8659 данные обучения,
0,662252 -9,86732 точности
0.985294 -9.86787 пока что
0,660066 -9,86823 гибрид
0,350698 -9,86914 обнаружение
0.733607 -9,87355 статистически значимо
0,700375 -9,87551 лес
0,922078 -9,87797 способный к
0,625749 -9,87829 все возможно
0,885542 -9,8791 выравнивания слов
0,744681 -9,88119 использовать
0,992424 -9,88126 и т. Д.)
0,783019 -9,88329 в данной работе мы
0,699248 -9,88411 по
0,785714 -9,88539 плоский
0,88024 -9,8856 32
0,748918 -9,88898 в виде
0,977778 -9,88997 цифра 5:
0,645161 -9,89191 с.
0,732218 -9,89509 находим, что
0.763636 -9.89794 разговор
0,89375 -9,89804 экспериментальная установка
0,722449 -9.89877 успехов
0,6231 -9,89882 занятых
0,468268 -9,

50
0,702703 -9,

строений
0.112037 -9.

и др.,
0,827957 -9,

0,
0.611111 -9. позже
0,6231 -9,

почему
0,562189 -9,

12
0,823529 -9,

грубый
0,705882 -9,90724 параллельное тело
0,

6 -9,90818 обычно используется
0,851429 -9,9084 соединений
0,8125 -9,9087 кросс-язычный
0,970149 -9,90902 повтор
0,581769 -9,91276 11
0,583784 -9,91473 с.
0,496094 -9,91511 будущая работа
0,63961 -9,91622 взвешивание
0,787129 -9,9181 выгода от
0.913333 -9,92337 на основе слов
0,682836 -9,92391 oov
0.955882 -9.92403 аннотации,
0,8 -9,92422 у.
0,774038 -9,92513 расширение
0,984375 -9,9264 речевой акт
0,93007 -9,92951 45
0,643333 -9,92982 с участием
0,619195 -9,93095 не обязательно
0,612121 -9,93196 и др., 2008).
0,607784 -9,9377 студент
0,652778 -9,93925 отношения между
0,984252 -9,94054 маргинальный
0,725322 -9,9429 взаимодействий
0,666667 -9,94374 извлечение событий
0,865031 -9,9446 случайно выбран
0,722222 -9,94535 WSD
0,727273 -9,9456 даже если
0.651568 -9,94586 13
0,669118 -9,9468 словарей
0,496957 -9,9498 почти
0,825843 -9,95149 первый шаг
0,99187 -9,954 и др.
0,821229 -9,95424 мелодия
0.6875 -9.95517 в этой статье.
0,99187 -9,95583 внутренняя
0.809783 -9.95803 два типа
0.669145 -9.95817 сообщение
0,916084 -9,95954 привело к
0,883117 -9,96238 принадлежащих
0,739726 -9,96285 целей
0,636364 -9,96355 результаты показывают, что
0,841176 -9,96355 область поиска
0,768473 -9,96422 не более
0.385856 -9.96453 наша система
0,771144 -9,96525 ниже, чем
0,697959 -9.96586 скорость
0,692 -9,96714 возможно
0,615873 -9,96724 способность
0,75 -9,9677 чешский
0,98374 -9,96879 не может
0.551282 -9.97605 следующим образом.
0.909091 -9.97629 сопоставлено с
0,717391 -9,97646 качество перевода
0,760976 -9,97649 таблица фраз
0,568306 -9,97757 общее количество
0,498947 -9,97819 обучающий набор
0.991667 -9.97893 опции
0,641115 -9,97914 мелкозернистый
0,707627 -9,97958 пар предложений
0.669202 -9.97975 исторический
0,843373 -9,98024 ч.
0,596386 -9,98075 использование
0,308126 -9,98226 различных
0,582133 -9.98548 субъективный
0,321869 -9,98616 данные обучения
0,78125 -9,98714 семья
0,723214 -9,98798 набрано
0,983333 -9,99157 с упором на
0,953125 -9,99219 диалоговые действия
0,72 -9,99 287 человек
0,691358 -9,9936 максимальная энтропия
0,436275 -9,99393 кроме того,
0.464684 -9.99464, чтобы узнать
0.8125 -9.99465 пунктов
0,359202 -9,99469 8
0,816092 -9,99532 детерминированный
0,462385 -9,99536 так, чтобы
0,624161 -9,99558 с включением
0,859873 -9,99582 контролируемое обучение
0.991525 -9.99678 форум
0,585799 -9,99779 неоднозначность
0,816092 -9.99833 восемь
0,667954 -10,0005 эффективно
0,884354 -10,0032 семантические роли
0.858974 -10.0043 имея дело с
0,705628 -10,0047 порядок слов
0,427663 -10,0058 факт, что
0,642599 -10,0096 порция
0.991379 -10.0119 уровень документа
0,768041 -10,0125 номинальное
0.567797 -10.0126 расположение
0,883562 -10,013 испытательный комплект,
0,704348 -10,0132 штраф
0,558904 -10,0141 универсальный
0,567797 -10,0154 в этой статье мы
0,381865 -10,0156 для улучшения
0.991379 -10.0161 неофициальный
0,852564 -10,0171 расхождение
0.982906 -10.0191 общедоступно
0.432343-10,02 короткое
0.991304 -10.0218 строения,
0.991304 -10.0219 фильтры
0,660232 -10,0222 идентификатор
0.526961 -10.0234 информация,
0,877551 -10,0235 На рисунке 2 показано
0,866667 -10,0254 близкородственные
0,434057 -10,0261 для извлечения
0,709821 -10,027 рабочих
0,643382 -10,0278 отношений,
0,662745 -10,0301 практический
0,748744 -10,033 эмпирически
0,898551 -10,0333 коррелирует с
0,462715 -10,0339 меньше
0,892857 -10,0342 в секции 2,
0,70852 -10,0342 функциональный
0,684874 -10,0346 различных типов
0,506912 -10.0352 15
0,99115 -10,0357 верхняя граница
0,798851 -10,0369 удерживать
0.910448 -10.037 заменено на
0,633094 -10,038 оракул
0.982609 -10.0382 существует
0,966387 -10,0401 имена,
0.929688 -10.0413 разговор
0,875 -10,0441 смит
0,794286 -10,0449 обработка
0,589905 -10,0453 уметь
0.541114 -10.0491 др.
0,839744 -10,0498 сопоставимые корпуса
0.922481 -10.0524 отличается от
0,443649 -10,0529 9
0,957983 -10,0532 в диапазоне от
0,530928 -10,0549 прогнозирование
0.702703 -10.0556 установочный комплект
0.413417 -10.0557 статистика
0.973913 -10,0566 в отличие от
0,965812 -10,0567 сглаженный
0.808383 -10.0571 имеет тенденцию к
0,950413 -10,0575 свои
0.943089 -10.0576 принят
0,825 -10,0603 гэ
0,489035 -10,0603 гипотезы
0,66129 -10,0631 вызовы
0,928571 -10,0635 рост
0,693333 -10,0637 плохое
0,852349 -10,0638 мягкий
0,784091 -10,0638 неопределенность
0,928571 -10,065, таблица 4 показывает
0,847682 -10,0651 26
0,908397 -10,0663 ситуаций
0,990909 -10,0676 выбор,
0.990909 -10.0677 контрольный показатель
0.878571 -10.0679 альтернатив
0,735 -10,0687 интегрирующий
0.914729 -10.069 проблемно
0,61324 -10,0691 и,
0,663934 -10,07 показали
0,74359 -10,0716 композиционный
0,487859 -10,0724 ниже
0,762162 -10,0729 илп
0,270014 -10,0743 10
0,883212 -10,0747 определить, есть ли
0,539295 -10,075 динамик
0,914062 -10,0776 в зависимости от
0.934426 -10.0787 смоделировано
0,906977 -10,0808 разговорный диалог
0.801205 -10.0814 коды
0,668067 -10,0819 разреженный
0.507246 -10.0841 важный
0,594684 -10,0844 25
0.990741 -10.0872 таблица 7:
0,88806 -10,088 прагматичный
0.990741 -10.0882 упаковка
0.990741 -10.0883 китайский-английский
0,360736 -10,0889 основной
0,517766 -10,09 то есть
0.704225 -10.0901 мы предполагаем, что
0,661157 -10,0901 счет для
0.803681 -10.0918 на основе синтаксиса
0.730964 -10.0937 и др., 2008)
0.294893 -10.0941 паутина
0,9

-10,0944 ложный
0.981651 -10.0953 в зависимости от
0,948718 -10,0955 остальное
0,9

-10,0969 31
0,451362 -10,0997 диапазон
0.384724 -10.1006 в этой статье
0,41806 -10,1013 точное
0,880597 -10,1028 политический
0,782353 -10,104 слабый
0,9

-10,1056 размер,
0,948276 -10,1059 условная вероятность
0.892308 -10,1059 Ки
0,947826 -10,1071 слотов
0.696262 -10.1074 в этом разделе
0,708738 -10,108 ак.
0,430357 -10,1084 f-балл
0,570978 -10,1107 потенциально
0,688073 -10,1117 случаев, когда
0,326132 -10,1136 сегментация
0,836735 -10,1139 предпочтительный
0,73057 -10,1159 нормализация
0,339286 -10,1161 обучено на
0.972477 -10.1163 общеизвестный
0.808917 -10.1176 сколько
0.822368 -10.1183 взято из
0.748634 -10.1183 слияние
0,739362 -10,1191 разреженность
0.768786 -10.1198 использовать
Форма 0.808917 -10.1207,
0,515544 -10.1208 за пределами
0,567823 -10,1219 иногда
0,501229 -10,122 2)
0.867647 -10.1221 лучше
0.585284 -10.1237 реплик
0.611722 -10.1242 для обнаружения
0,92437 -10,1242 лексических единиц
0.92437 -10.1249 правильность
0,522788 -10,125 грамматик
0.672566 -10.1253 извлечение информации
0,783133 -10,1262 униграмм
0.578947 -10.1283 связь
0.566038 -10.1287 поле
0.980952 -10.1288 отфильтровать
0.877863 -10.131 интернет
0,634921 -10,1316 конкретно
0,85 -10,1332 общедоступный
0,770588 -10,1335 специализированный
0,16453 -10.1349 таких как
0,9

-10,135 1999)
0.806452 -10.135 это означает, что
0,938596 -10,1353 поддеревья
0,566879 -10,1357 в основном
0.562893 -10.1357 относится к
0.445972 -10.1359 в производстве
Структура 0,62069 -10,137,
0.946429 -10.1379 отношения между
0,9

-10,1382 крайний
0,810458 -10,1382 параллельные корпуса
0,848921 -10,1395 б)
0,576159 -10,1405 эффективность
0.451417 -10.1411 предыдущая работа
0,555215 -10,1424 вида
0.665198 -10.1434 проанализировано
0.308129 -10.1436 рейтинг
0,583051 -10,1439 характер
0.612782 -10,1443 неверно
0.828767 -10.1452 просмотров
0,923077 -10,1452 запросов,
0.722513 -10.1464 много
0.9

-10.1471 экстрактор
0.9

-10.1477 социальные сети
0.609665 -10.1478 письмо
0,599278 -10,1486 типов,
0.9

-10.149 перекрестная проверка
0,419014 -10,1503 особенно
0.570033 -10.1509 проб
0,895161 -10,1512 векторное пространство
0.915254 -10.1512 правильно
0.888889 -10.1514 токенизация
0,772455 -10,1518 средствами
0,564103 -10,1521 бумаги
0,980583 -10,1526 направленное
0,747191 -10,1532 небольшое количество
0.232824 -10,1541 без
0,971429 -10,1553 уменьшение погрешности
0,6 -10,1555 разрыв
0,489104 -10,1562 разница между
0.602941 -10.1578 дерево разбора
0,760234 -10,1592 глубина
0,929825 -10,1593 синонимия
0,836879 -10,1607 рекурсивный
0.869231 -10.161 соглашение между аннотаторами
0,888 -10,1614 фрагменты
0,738889 -10,1619 деревья синтаксического анализа
0.830986 -10.1626 важно
0,962264 -10,1633 конечно,
0,953704 -10,1634 уходящий
0.426716 -10.1646 статистическая машина
0.798701 -10.1647 направлен на
0,99 -10,1652 48
0,84058 -10.1653 последовательный
0,99 -10,1654 44
0,741573 -10,1658 равно
0,751445 -10,1677 быстро
0.893443 -10.1688 схема аннотации
0,399674 -10,169 высоко
0,868217 -10,1699 обучающий набор,
0.961905 -10.1699 корейский
0,533528 -10,1701 просодический
0,62753 -10,1706 б.
0,713542 -10,1709 смысловое значение
0,989899 -10,1716 и т. Д.
0,574324 -10,1717 неявный
0,718085 -10,1741 обучающий набор.
0,989899 -10,175 содержание,
0,271624 -10,1759 полный
0.886179 -10.1765 чат
0,668203 -10,1771 консистенция
0,792208 -10,1776 наборов функций
0.542683 -10,1777 полууправляемый
0,519553 -10,1785 пунктуация
0,844444 -10,1792;
0.582456 -10.1802 начальная загрузка
0,521127 -10,1802 популярное
0.409722 -10.1811 арабский
0,3

-10,1826 вас
0,989796 -10,1833 ансамбль
0,519663 -10,1837 приблизительно
0,729282 -10,1859 витерби
0,586331 -10,1893 хотя
0,833333 -10,19 независимо от
0,794702 -10,19 без каких-либо
0,693467 -10,1914 На рисунке 1 показано
0.552716 -10.1917 рисунок 1.
0,646288 -10,1917 мелкий
0.970297 -10.192 Население
0,927928 -10,1921 кл
0,541538 -10.1924 причина
0.808219 -10.193 раздел 4.
0.885246 -10.1933 настоящая работа.
0.550955 -10.1935 рисунок 3:
0,734463 -10,1942 куски
0.827338 -10.195 новостных статей
0,392569 -10,1955 de
0,989691 -10,1955 дисплей
0.866142 -10.1961 маркировка ролей
0,816901 -10,1961 отсрочка
0.989691 -10.1966 предложение
0.952381 -10.1967 сильнее
0.422932 -10.197 онлайн
0,705263 -10,1983 возможно
0.842105 -10.1984 пространство функций
0,737143 -10,1985 разнообразие
0.798658 -10.1985 ф.
0,497396 -10,1988 40
0,951923 -10,1994 а1
0.723757 -10.2002 извлечено
0.853846 -10.2007 л.
0,678049 -10.2007 внахлест
0.747059 -10.2009 паттерны,
0,847328 -10,201 преобразованный
0,329143 -10,201 китайский
0.842105 -10.2012 транскрипция
0.811189 -10.2012 факты
0.842105 -10.2041 вызвано
0.806897 -10.2043 давайте
0.826087 -10.2052 аннотации
0.693878 -10.2056 пут
0,71978 -10,2061 19
0,501333 -10,2065 приблизительно
0,951923 -10,2077 250
0,521739 -10,21 доходность
0,718232 -10,2104 значимый
0,759259 -10,2117 абстрактивный
0,59176 -10,2121 существенное
0,779221 -10,2124 метки,
0,657407 -10.213 эвристики
0,210826 -10,2132 несколько
0,393388 -10,2136 обычно
0.606299 -10.2151 хинди
0,676471 -10,2168 беглость
0,35 -10,2169 100
0,7625 -10,217 объединить
0,910714 -10,2175 диалектный
0,989474 -10,2176 не имеет
0,630901 -10,2177 определяется
0,481297 -10,2181 изменено
0,888889 -10,2194 координация
0,95098 -10,2195 при условии
0,96 -10,22 гиперграф
0,989474 -10,2201 просодия
0,895652 -10,2203 актуальные
0.647059 -10.2208 к.
0.979167 -10.2211 сложнее
0,774194 -10,2217 теги pos
0,851562 -10.2219 шведский
0,814286 -10,2223 150
0,681818 -10,2244 ситуация
0,772727 -10,2254 многословное
0,850394 -10,227 ограничения
0,451327 -10,2273 группы
0,868852 -10,2274 физический
0,828358 -10,2279 чисто
0,989362 -10,2282 тривиально
0,590909 -10,2283 на самом деле,
0,868852 -10,2287 раздел 3,
0,989362 -10,2289 договор,
0,594595 -10,2307 доля
0,588679 -10,2317 частей
0,730994 -10,2328 баллов bleu
0,53605 -10,2328 мес
0,

6 -10,2334 ошибочный
0.959596 -10.2335 твитов,
0.405745 -10.2341 текстовый
0.702703 -10,2344 (%)
0,691099 -10,2345 условный
0.802817 -10.235 лучшая производительность
0,594595 -10,2351 отрицание
0.678392 -10.2362 рисунок 2.
0,482143 -10,2371 и т. Д.
0.469734 -10.2375 наборов данных
0,941748 -10,2388 обозначает
0.560554 -10.2391 дополнительный
0,38843 -10,2392 длинный
0,909091 -10,2393 блю,
0,854839 -10,2397 набор данных,
0,65566 -10,24 достаточно
0,643836 -10,2401 в сочетании с
0.576642 -10.2407 кадров
0,423228 -10,2411 парафраз
0.893805 -10.2414 в.
0,860656 -10,2421 k-среднее
0,978947 -10,2421 рассматривается как
0.579336 -10,243 мы ориентируемся на
0,743902 -10,2437 цифра 1,
0,754717 -10,2446 пара фраз
0,801418 -10,2447 допущений
0,6875 -10,2452 тестовых набора
0,886957 -10,2454}
0,95 -10,2457 разное
0,872881 -10,246 ·
0.98913 -10.246 адресация
0,636771 -10,2462 перефразируя
0,96875 -10,2472 касается
0,220257 -10,2475.
0,542484 -10,2475 явления
0,782313 -10,248 мы видим, что
0.84252 -10.249 появляется в
0,87931 -10,2494 хуже, чем
0.98913 -10.2495 классификаторы,
0,479592 -10,2501 только один
0,98913 -10,2505 мм
0.87931 -10,251 начато
0,577778 -10,2513 виртуальный
0,892857 -10,2522 без выравнивания
0,718391 -10,2528 путем применения
0.685864 -10.2529 эксперимент с
0,853659 -10,2546 плавление
0,442982 -10,2556 юниграмма
0,578358 -10,256 базовых линий
0,777027 -10,2567 эмоций
0.808824 -10.2572 дас
0,564286 -10,2582 предпочтение
0,737805 -10,2583 таргетировано
0,829457 -10,259 одинарный
0.892857 -10.2592 реализация
0,649289 -10,2594 чрезвычайно
0,989011 -10,2596 вербнет
0,658537 -10,2597 обобщение
0,658537 -10,2601 современный
0,350345 -10.2615 вопросов
0,9 -10,2616 звук
0,931373 -10,2626 больше не
0,576779 -10,2632 коричневый
0.629464 -10.2634 таблица 3.
0,46683 -10,2636 последний
0,846774 -10,2638 оценка
0,663366 -10,2655 реляционный
0,858333 -10,2657 выражений,
0,94898 -10,2677 перегибной
0,361357 -10,2684 в мире
0,988889 -10,2684 кредитное плечо
0,931373 -10,2684 понятий,
0,697802 -10,2686 пересечение
0,615385 -10,2692 все три
0,59127 -10,2692 в соответствии с
0,858333 -10,2703 различать
0,75 -10,2716 активное обучение
0.899083 -10.2725 происходит от
0,77027 -10,2729 бетон
0,883929 -10,2736 мер,
0,391304 -10,2739 маркировка
0,43129 -10,2746 биграмм
0,731707 -10,2748 об.
0,761589 -10,2748 их соответствующие
0,595142 -10,2757 слот
0,753247 -10,2757 резервный
0,668367 -10,276 цепь
0.698324 -10.2786 длительность
0,85124 -10,2788 сходство распределения
Выравнивание 0.801471 -10.2788,
0,32801 -10,279 соответствие
0,71345 -10,2796 (2003)
0.773973 -10.2798 дорого
0,

-10,28 конструкций
0,939394 -10,2806 ненаправленный
0,54 -10.2807 создание
0,890909 -10,2807 нк
0,394316 -10,2812 имен
0,563636 -10,2813 ноль
0,393617 -10,2827 следствие
0,988764 -10,2828 подключить
0.460048 -10.2829 для создания
0,378913 -10,2834 показано в таблице
0,957895 -10,2839 мы предполагаем, что
0,318605 -10,2842 кластера
0,869565 -10,2852 игрока
0.505882 -10.2854 методология
0,921569 -10,2856 снизу вверх
0.706897 -10.2858 выбор функции
0.608511 -10.2859 (в)
0.78169 -10.2859 обучение
0.631336 -10.2865 старые
0,862069 -10,2871 немецкий,
0,832 -10,2877 онтологический
0.475196 -10,2884 тип.
0.599174 -10.2885 уточнено
0,85 -10,2886 открытие
0,512121 -10,2913 возврат
0.27758 -10.2913 ограничения
0,27383 -10,2913 под надзором
0.4 -10.2919 замещение
0,988636 -10,2926 полином
0.868421 -10.2933 шток
0.
2 -10.2935 заказа (ов)
0,875 -10,2944 фундаментальный
0,698864 -10,2945 идеально
0,988636 -10,2949 троек
0,479893 -10,2966 в частности
0,938144 -10,2969 максимальное правдоподобие
0,698864 -10,297 обобщить
0,440181 -10,2974 шкала
0,451306 -10,2974 часто
0,881818 -10.2976 косвенный
0.286948 -10.2991 тег
0,513846 -10,2996 мВт.
0.920792 -10.302 кодирует
0.601695 -10.3026 обнаружено
0.551601 -10.3036 код
0,255141 -10,3036 случайный
0,424051 -10,3043 полностью
0,761905 -10,3058 (см. Рисунок
0.988506 -10.3064 тренды
0,967033 -10,3065 усреднено по
0.697143 -10.3066 аннотирование
0,788321 -10,3066 языковые пары
0,988506 -10,3073 вложено
0.928571 -10.3076 качество,
0,956989 -10,3079 маркировка
0,988506 -10,3082 линейно
0,988506 -10,3089 кроме
0,988506 -10,3099 подъем
0,988506 -10.3099 51
0.719512 -10.3109 синоним
0.327434 -10.3118 сводка
0,584677 -10,3119 получаем
0.873874 -10.3121 интерпретация
0,594142 -10,3132 иерархия
0,834711 -10,314 нерелевантно
0,988372 -10,3141 в свободном доступе
0,594142 -10,3145 наличие
0,479564 -10,3153 идти
0,846154 -10,3165 четвертый
0,988372 -10,3167 выравнивания,
0,65641 -10,3168 достигнуто
0,421053 -10,3169 горное дело
0,946809 -10,3174 собственные
0,9375 -10,3178 ошибок
0,966667 -10,3183 локально
0,36378 -10,3186 покрытие
0,364353 -10,3188 временная
0.539792 -10,3189 распределено
0,946809 -10,3193 подвержены влиянию
0,988372 -10,3193 интерпретировать
0,552727 -10,3194 решения
0,977273 -10,3195 обнадеживает
0,514196 -10,3196 многоязычный
0,679558 -10,3199 сходства
0,988372 -10,3201 направлено на
0,87963 -10,3215 5)
0,369106 -10,3226 триггер
0,988235 -10,3236 наивный байесовский
0,50303 -10,3241 памяти
0,746667 -10,3241 самообучение
0,791045 -10,3245 ​​опрос
0,675824 -10,3261 путем добавления
0.444444 -10.3262 отзыва
0,87156 -10,3272 в среднем,
0,495575 -10,3274 сырые
0,72327 -10.3275 классифицировано как
0.640394 -10.3286 плохо
0,506135 -10,3286 θ
0,858407 -10,329 номинальное
0,738562 -10,3291 развернутый
0,733766 -10,3298 нейтральный
0,584362 -10,3306 отношение между
0,988235 -10,3314 только,
0,8 -10,3317 голландский
0,785185 -10,3318 чувствителен к
0,826446 -10,3322 крупнозернистый
0.988235 -10.3325 настройки,
0,988235 -10,3326 2,5
0,927083 -10,333 логическая форма
0,988235 -10,3335 т.н.
0,558491 -10,3339 операций
0,426374 -10,334 прогнозов
0.804688 -10.3341 первого порядка
0.607143 -10.3355 версии
0.988095 -10,336 случайное блуждание
0,278351 -10,3366 кластеризация
0,415449 -10,3374 1)
0,547101 -10,3378 23
0,498489 -10,3385 прочный
0,571429 -10,3388 личный
0,491228 -10,339 бег
0,885714 -10,3392 второго порядка
0,732026 -10,3393 румяна
0.607143 -10.3397 анализ настроений
0,783582 -10,3398 рассуждение
0,988095 -10,34 сложный
0,412371 -10,3409 млн.
0,585774 -10,3416 преобразование
0,664865 -10,3419 технический
0,877358 -10,3423 к-лучшая
0,79845 -10,3434 солодовый парсер
0,22454 -10,344 лингвистический
0.604444 -10.3441 равно
0,471545 -10,345 внешний
0,525253 -10,3453 на основе правил
0,80315 -10,3457 резервирование
0,830508 -10,3457 полисов
0.43418 -10.3475 явное
0,672222 -10,3482 участвует в
0,328477 -10,3495 f1
0,792308 -10,3495 в данной статье представлены
0,877358 -10,3497 происходит из
0,632353 -10,3501 сопоставления
0,387454 -10,3507 поверхность
0.577869 -10.3508 удаление
0,758865 -10,3511 словосочетаний
0,253956 -10,3513 за
0,52 -10,3515 классифицировать
0,987952 -10,3524 различий
0,741497 -10,3526 разговоров
0,965517 -10,3526 лицо
0.9 -10,3531 33
0,987952 -10,3532 скорректировано
0,781955 -10,3541 (с использованием
0,848214 -10,3541 (поз)
0.606335 -10.3541 словарный запас
0,823529 -10,3547 высокий уровень
0.848214 -10.3547 начиная с
0,610092 -10,355 усилия
0,908163 -10,3551 ди
0,916667 -10,3554 универсальный
0,9 -10,3556 аннотаторов-людей
0,71519 -10,3556 лм
0,987952 -10,3559 приходится на
0,925532 -10,3568 Общая задача bionlp
0,916667 -10,3577 как и ожидалось,
0,26899 -10,3584 событий
0,372852 -10,3595 сильная
0,291099 -10,3597 алгоритмов
0,97619 -10,3609 41
0.944444 -10,3611 штраф
0.806452 -10.3624 прототип
0,987805 -10,363 наиболее вероятный
0.281219 -10.364 категории
0,965116 -10,3641 без
0,3859 -10,3641 —
0,481268 -10,3646 включено в
0,891089 -10,3652 36
0,310552 -10,366 узор
0,854545 -10,3662 девять
0,748252 -10,3666 больше чем
0,628713 -10,3671 шаблон
0.834783 -10.3671 фрагменты
0,518519 -10,3673 набор функций
0,678161 -10,3678 клинический
0,482558 -10,368 попарно
0.371972 -10.3681 балл
0.965116 -10.3686 воспользоваться преимуществом
0,924731 -10,369 многозначность
0.907216 -10,37 очищенный
0,672316 -10,3706 суффикс
0,743056 -10,3708 ваш
0,793651 -10,3713 удовлетворяет
0,62439 -10,3715 критерий
0,652406 -10,3724 300
0,774436 -10,3724 экземпляра,
0,692771 -10,3731 захвата
0,822034 -10,3732 2007 г.
0,934066 -10,3739 предсказатель
0,680233 -10,3744 хеш
0,652406 -10,3754 установлено
0.726667 -10.376 оценка
0,456693 -10,3768 японский
0,59292 -10,377 униформа
0,975904 -10,3779 речевых актов
0,987654 -10,378 представлений,
0.682353 -10.3791 база знаний
0,721854 -10,3793 ограничения,
0.695122 -10.3804 переплет
0,987654 -10,3813 слог
0,457672 -10,3815 жесткий
0,422122 -10,3815 отчетливый
0,42369 -10,3821 составляющая
0,718954 -10,3823 их,
0,678363 -10,3824 ограничения на
0,964706 -10,3825 и т. Д.).
0,987654 -10,3831 37
0,776923 -10,3834 языковое моделирование
0,

-10,3834 позволяют
0,953488 -10,3835 шаблоны функций
0,513423 -10,3837, как описано в
0,914894 -10,3845 шт.
0,826087 -10,385 Вт
0,964286 -10,3851 смысловая направленность
0,943182 -10,3857 иначе
0,845455 -10,3858 блок
0.396 -10,3868 из
0,826087 -10,3879 претензий
0,831858 -10,3879 сетка
0.943182 -10.388 связывание сущностей
0,552529 -10,3883 изучено
0,471591 -10,3884 контроль
0.634021 -10.3893 полезность
0,9875 -10,3902 лога
0.808333 -10.3902 экран
0,964286 -10,3909 поисковая система
0,695652 -10,3909 естественно
0,831858 -10,391 достаточно
0,913978 -10,3914 10,
0,757353 -10,3917 богаче
0,28012 -10,392 комплекс
0,837838 -10,393 векторов признаков
0,562753 -10,3933 научный
0,

3 -10,3936 фунтов стерлингов
0.766917 -10.394 или
0,648649 -10.3949 добывающий
0,49375 -10,3949 49-е годовое собрание
0,818966 -10,3949 группировка
0,837838 -10,395 цепи
0,

3 -10,3953 мера,
0.761194 -10.3954 есть много
0.519031 -10.3957 анализ,
0,9875 -10,3961 43
0,471429 -10,3965 Дж.
0,830357 -10,3972 контрастный
0,560976 -10,3975 крупномасштабный
0,987342 -10,3975 пока что,
0,166489 -10,3979 базовый уровень
0,751825 -10,3981 разн.
0,844037 -10,3983 деревья зависимостей
0.857143 -10.3984 г.
0,437346 -10,3987 шагов
0.872549 -10.3988 команд
0,932584 -10,4001 атомный
0.5 -10.4013 уход
0.932584 -10.4018 теорема
0,963855 -10,4018 инг
0,632124 -10,4019 знак
0,987342 -10,4019 цифра 6:
0,963855 -10,402 сложности
0,913043 -10,4025 иерархическая фраза
0.836364 -10.4025 светлый глагол
0,887755 -10,4026 композит
0,88 -10,4026 карнеги-меллон
0,987342 -10,4028 индуцирующий
0,987342 -10,4031 удаляет
0,987342 -10,4032 чистый
0,572034 -10,4034 проекция
0,952941 -10,4036 в этом исследовании,
0,932584 -10,4037 28
0,987342 -10,4041 г.
0,811966 -10,4044 коллаборативный
0,987342 -10.4051 все больше
0,69375 -10,4059 кортежей
0,987342 -10,4071 сокращений
0,492114 -10,4075 эксперт
0,400835 -10,408 объем
0,849057 -10,4081 дискурсивные отношения
0,414798 -10,4082 лда
0,737589 -10,4097 сбалансированный
1 -10.4098 мвес.
0,553785 -10,41 3)
0.718121 -10.4102 ресурсов,
0.535581 -10.4112 синтаксический анализ,
0,987179 -10,4112 стандартное отклонение
0,506711 -10,4118 полностью
0,598131 -10,4121 захватов
0.564315 -10.4121 мы звоним
0.676647 -10.4122 для домена
0,710526 -10,4128 наиболее часто встречающиеся
0.975 -10.413 скидка
0.931818 -10.4131 принять
0,357262 -10,4139 французский
0,952381 -10,4142 друг друга,
0,575758 -10,4143 прогнозируемый
0.894737 -10.4146 гарантия
0.535581 -10.4147 существует
0,886598 -10,4149 обработано
0,855769 -10,415 предикторов
0,512027 -10,4154 прироста
0,975 -10,4154 итого,
0.855769 -10.4158 нью-йорк
0,987179 -10,4164 неполное
0,544747 -10,4164 произвольно
0,468391 -10,4165 фон
0.834862 -10.4167 рассмотрение
0.931818 -10.4172 майнинг мнений
0.987179 -10.4175 кластеризация,
0.334311 -10.4181 требуется
0,698718 -10.4183 КПД
0,987179 -10,4184 в расслабленном состоянии
0.798319 -10.4195 выпущено
0.602871 -10.4197 попроще
0,841121 -10,4198 rte
0,651685 -10,4199 вектор признаков
0,565401 -10,4199 фразовый
0.405172 -10.4199 текст,
0,547244 -10,4207 действительно
0,912088 -10,421 в разделе 4,
0,4573 -10,4211%
0.827273 -10.422 принадлежит
0,525547 -10,4221 β
0,668639 -10,4229 путем сравнения
0,23508 -10,4232 что такое
0,893617 -10,4238 1 000
0,815789 -10,4245 предшествующие работы
0,377111 -10,4254 уникальный
0,987013 -10,4257 гибкость
0.321088 -10.4257 требуется
0.893617 -10,4259 ssc
0,628272 -10,4263 классифицирующий
0.877551 -10.4264 теги части речи
0,668639 -10,4265 экземпляр
0,814159 -10,4267 es
0,680982 -10,4267 поворотный
0,61194 -10,4268 экспертов
0,496732 -10,4268 обрезка
0,412162 -10,427 эффективное
0.459384 -10.4271 выпусков
0,61194 -10,4279 по сравнению с
0,

4 -10,4288 деление
0,363796 -10,429 сводки
0,987013 -10,4293 кандидата,
0,495114 -10,4293 крышка
0,962963 -10,4296 дискурсных связок
0,911111 -10,4298 предикатов,
0,827273 -10,4302 соответствующий
0.987013 Рейтинг -10.4305
0,714286 -10,4305 оценка
0,711409 -10,4305 быстро
0,35082 -10,4306 лм
0,699346 -10,4306 признано
0.951807 -10.4307 блогов
0,987013 -10,4309 поиск,
0,941176 -10,4315 относительная частота
0,780488 -10,432 куб.
0,448925 -10,4328 нормализованное
0,987013 -10,433 перегиб
0,448925 -10,434 вариация
0,655172 -10,4348 корреляция между
0.709459 -10.4355 организация
0,613065 -10,4355 выбрано
0,833333 -10,4361 сколько
0,733813 -10,4365 дало
0.241621 -10.4368 хорошо
0,725352 -10.4373 предпочитаю
0,769841 -10,4377 лист
0.755725 -10.4379 идей
0,482866 -10,4379 (5)
0,930233 -10,438 2),
0,231707 -10,438 паттернов
0,561181 -10,439 относительно
0.940476 -10.4402 содержание
0,585253 -10,4403 в основном
0,75969 -10,4404 аргумента,
0,81982 -10,4412 29
0,709459 -10,4413 итеративный
0,514184 -10,4416 WSJ
0,9625 -10,4419 1,5
0,867347 -10,4421 27
0,731884 -10,4421 проверка
0,731884 -10,4427 на основе данных
0,838095 -10,4434 длина,
0,831776 -10,4438 многочисленные
0,55102 -10,4439 рядом
0.9625 -10.4442 базы данных
0.455307-10.4444 править
0.774194 -10.4444 адреса
0,95122 -10,445 аудио
0,72028 -10,4453 расширения
0,210652 -10,446 кратное
0,986842 -10,4463 морфосинтаксический
0,986842 -10,4464 34
0,91954 -10,4469 «я
0,454039 -10,4475 шесть
0,838095 -10,4482 а точнее
0,408578 -10,4484 30
0.60396 -10.4486 местоимений
0.986842 -10.4488 картинка
0,715278 -10,4492 классификация настроений
0.891304 -10.4499 парсеры,
0,615385 -10,4501 ничья
0,910112 -10,4504 расшифровано
0,503448 -10,4507 ср.
0,534884 -10,4511 на основе графиков
0.522222 -10,4512 сильно
0,183729 -10,4514 —
0,929412 -10,4514 аа
0,71831 -10,452 самый короткий
0,867347 -10,4532 состоял из
0,726619 -10,4536 земля
0,986667 -10,4536 устранение неоднозначности
0,84466 -10,4537 популярности
0,974026 -10,4548 по этой причине,
0.986667 -10.4548 поведение
0,710345 -10,4554 долей
0,986667 -10,4556 несоответствие
0,710345 -10,4557 доступно,
0,584112 -10,4561 сегментация слов
0,710345 -10,4563 отдельно
0,649425 -10,4565 когнитивный
0,721429 -10,4566 эксплуатируется
0,9 -10,4573 функции,
0.986667 -10,4573 избегая
0,950617 -10,4573),
0,9 -10,4575 можно легко
0,882979 -10,4576 конкурирующие
0.824074 -10.4578 бывает
0.939759 -10.4586 интеллектуальный анализ текста
0.950617 -10.4587 совместим с
0,986667 -10,459 демографический
0,742424 -10,4594 смешанный
0,610256 -10,4601 немаркированные данные
0.702703 -10.4606 модификаций
0,793103 -10,461 выгодно
0,440318 -10,4613 сегмент
0,751938 -10,462 шток
0,803571 -10,4628 (2006),
0,793103 -10,463 сильно
1-10.4632 модуль.
0.766129 -10.4637 кодировка
0.95 -10.4645 проверено
0.603015 -10,4648 возможность
0.88172 -10.4655 генерируется автоматически
0,664634 -10,4655 ни один из
0,95 -10,4662 плохо
0,588517 -10,4665 это не
0,88172 -10,4665 двоичная классификация
0.857143 -10.4669 оценка f1
0,95 -10,4674 иеро
0,716312 -10,4677 существующий
0,679487 -10,4681 обработано
0,755906 -10,4684 было
0,422222 -10,4692 см
0.88172 -10.4693 отчетность
0,986486 -10,4695 доступно
0.344262 -10.4696 классификаторы
0,736842 -10,4699 перерыв
0,391121 -10,4703 действие
0,588517 -10,4703 сети
0.775 -10.4705 очень похоже
0.660606 -10.4706 рассказ
0.507143 -10.471 разведано
0,961538 -10,4711 описательный
0,522727 -10,4718 редко
0,986486 -10,4719 координата
0,986486 -10,472 классический
0.485342 -10.4721 описания
0,986486 -10,4722 рабочий
0,927711 -10,4723 числовой
0,986486 -10,4728 разложено
0,633333 -10,473 анафора
0,445983 -10,4735 шт.
0,693333 -10,4735 метрики оценки
0,79646 -10,4737 собственный
0,927711 -10,4738 разваливается
0,731343 -10,4742 причины
0,440541 -10,4746 динамиков
0,961538 -10.4747 дс
0,917647 -10,4748 Java
0.579439 -10.4749 блог
0,496575 -10,4751 частоты
0,465257 -10,4754 действующий
0.496552 -10.477 добавлено к
0,246414 -10,4771 они есть
0,801802 -10,4786 эпи
0,522901 -10,4793 примерно
0,880435 -10,4802 наивное
0,773109 -10,4809 логарифм правдоподобия
0.986301 -10.481 выполнить
0,85567 -10,4811 коллективный
0,986301 -10,4815 оценено
0,789474 -10,4818 с учетом
0,758065 -10,482 служат
0,357143 -10,4821 написано
0.570776 -10.4822 оценки
0,371373 -10,483 ранее
0,509091 -10.483 по умолчанию
0,986301 -10,4843 неоднородный
0,85567 -10,4844 обозначается
0,961039 -10,4848 reuters
0,729323 -10,485, что означает
0,693878 -10,4851 извлечение отношения
0.609375 -10.486 определяющий
0,949367 -10,4862 38
0,729323 -10,4867 покрытие
0.606218 -10.487 машинный перевод,
0,789474 -10,4873 исключено
0,906977 -10,4876 ап
0,863158 -10,4877 комбинация.
0,664596 -10,4883 шанс
0,70922 -10,4893 слов)
0,916667 -10,4893 средний
0,973333 -10,4894 набор текста
0.916667 -10.4903 перезапись
0,532 -10,4903 относительно
0.916667 -10.4904 коэн
0.863158 -10.4907 n-лучший список
0,766667 -10,4907 релаксация
0,206111 -10,4908 подходов
0,432718 -10,4911 изменений
0,8 -10,4916 чувств,
0,52549 -10,4922 обработка естественного языка,
0,9375 -10,4923 56
0,972973 -10,4926 Вт 2011 г.
0,916667 -10,4927 (вроде
0.846939 -10.4927 схема
0,386892 -10,4933 н-граммов
0,746032 -10,4935 тезаурус
0,863158 -10,4939 дискретный
0,42 -10,4942 отсюда
0.656442 -10.4945 наши эксперименты.
0,771186 -10,4947 дополнение
0.948718 -10.4948 стратегий.
0,364839 -10.4949 контекстных
0,88764 -10,4954 с учетом
0,372781 -10,4964 дискриминационный
0,491409 -10,4971 г.
0,305851 -10,4976 пять
0,732824 -10,498 ли
0,732824 -10,4983 мотивировано
0.433155 -10.4984 для выбора
0,285219 -10,4985 wordnet
0.960526 -10.4986 мобильный
0,428198 -10,4988 неверно
0,771186 -10,4991 генеративная модель
0,986111 -10,5 8,
0,547009 -10,5002 точность,
0,699301 -10,5003 мы принимаем
0,986111 -10,5004 вычислений
0,896552 -10,5007 адаптивная
0,861702 -10,5017 стабильность
0,38961 -10,5019 неоднозначно
0.960526 -10,5021 2009 г.,
0,364326 -10,5031 на тренировку
0,694444 -10,5036 значений,
0,986111 -10,5039 парадигмы
0,446991 -10,5048 мало
0,925926 -10,5051 пропорционально
0,817308 -10,5051 деревце
0,425974 -10,5053 присвоено
0,330203 -10,5054 в комплекте
0.609626 -10.5054 управление
0,670968 -10,5054 кроме
0.373253 -10.5055 приложений
0,151129 -10,5055 нет
0,432796 -10,5057 эвристика
0,432796 -10,5059 аннотатор
0,948052 -10,5062 расширяющийся
0,491349 -10,5064 контекст,
0,785714 -10,5072 дерево решений
0,744 -10.5072 португальский
0,47557 -10,5081 правил,
0,355839 -10,5091 (а)
0,627119 -10,5093 важность
0,528226 -10,5094 субъективность
0,869565 -10,5095 франция
0.404706 -10.5095 выполнить
0,985915 -10,5096 наддув
0.373494 -10.5101 зв.
0,326687 -10,5103 изменить
0,59 -10,5 · 103 на основе переходов
0,555556 -10,5104 учебный корпус
0,985915 -10,5107 медленно
0,725191 -10,5109 требуется
0,936709 -10,5118 модель ibm
0.530364 -10.512 posts
0,570755 -10,5124 возможно
0,96 -10,5125 Удовлетворенность пользователей
0,438889 -10,5127 автоматизировано
0.936709 -10,5128 53
0,517375 -10,5129 исходный язык
0,734375 -10,5133 на уровне слов
0.583333 -10.5135 опубликовано
0,895349 -10,5135 коробка
0,886364 -10,5136 52
0,481605 -10,5138 медицинский
0,556054 -10,5144 повторный
0,381053 -10,5147>
0,

2 -10,5151 вне словарного запаса
0,457576 -10,5162 вводим
0,310924 -10,5165 проба
0,628571 -10,5167 триггеров
0,96 -10,5171 напротив,
0,747967 -10,5173 получить
0,336066 -10,5181 комбинация
0,494662 -10,5182 архитектура
0,620112 -10,5183 объединено
0,778761 -10.5189 пробелов
0.809524 -10.5189 указывает
0,444126 -10,5194 отсутствует
0.972222 -10.5195 исправить
0.708029 -10.521 представил
0,985714 -10,5211 как таковое,
0,620112 -10,5216 scfg
0,389381 -10,5218 первичный
0,752066 -10,5218 набор разработки.
0.836735 -10.5222 помещение
0,376033 -10,5227 понимание
0,503704 -10,5229 путей
0.836735 -10.5232 есть несколько
0,559633 -10,5235 понятие
0,778761 -10,5237 непроективный
0.297542 -10.524 сейчас
0,261477 -10,5245 обработка
0.677852 -10.5245 предложение
0,985714 -10,5247 поиск луча
0.851064 -10,5249 мса
0,925 -10,5253 поиска
0,947368 -10,5259 на основе зависимостей
0,885057 -10,526 прилагательное-существительное
0.851064 -10.5261 рассказы
0,752066 -10,5267 монотонный
0.719697 -10.5273 доменов,
0.556561 -10.5273 диаграмма
0.985714 -10.5276 реализаций
0,947368 -10,5281 легко
0,821782 -10,5282 64
0,858696 -10,5284 а.и.
0,807692 -10,5285 учитель
0,695035 -10,5285 35
0,395402 -10,5292 г
0,985714 -10,5294 гипотетически
0,745902 -10,5295 минор
0,947368 -10,5295 95
0,400943 -10,5298 ген
0,

4 -10,5301 отношения
0.367793 -10,5304, чтобы получить
0,673333 -10,5306 поддерживает
0,337229 -10,5307 списков
0,55157 -10,5308 построить
0,788991 -10,5308 2000),
0,985714 -10,5311 нацелено на
0,972222 -10,5313 сбор,
0,394077 -10,5314 открытый
0,924051 -10,5319 проекционный
0,756303 -10,5319 родной брат
0,985714 -10,5327 по категориям
0,91358 -10,5333 грамматической индукции
0,765217 -10,5345 медиана
0,726562 -10,5346 разведка
0,82 -10,5354 определителя
0,334992 -10,5355 представлений
0.602151 -10.5359 для оценки
0,528926 -10,5374 500
0,8 -10.5374 сервис
0,430137 -10,5378 семантически
0.314788 -10.5378 наша модель
0,892857 -10,539 функция подсчета очков
0.658065 -10.5394 обнаружено
0,971831 -10,5397 (оба
0,958904 -10,5405 с этой целью,
0,985507 -10,5405 зависит от языка
0,849462 -10,5406 покрыто
0,417098 -10,5406 но не
0,9 -10,5409 легкость
0.765217 -10.5415 заявлено
0,577114 -10,5417 суммы
0,892857 -10,542 (все
0,453988 -10,5421 видим
0.849462 -10.5422 высокое качество
0,459119 -10,5424 детей
0,55814 -10,5427 оптимизировано
0,743802 -10.5428 идентично
0,9 -10,5429 обозначается
0,226994 -10,5435 поперек
0,774775 -10,5436 индексация
0.61236 -10.5436 карт
0.958904 -10.544 твиттер,
0,883721 -10,544 к,
0,611111 -10,5442 показателей
0,515873 -10,5446 разная
0,758621 -10,5449 интерполированный
0,671141 -10,545 заголовков
0.892857 -10.545 реализация
0,544248 -10,5452 указывают, что
0.934211 -10.5455 личные данные
0,641975 -10,5455 альтернатива
0,923077 -10,5455 разметка
0,534188 -10,5456 эффективно
0,685315 -10,5457 г.
0,934211 -10,5458 нп,
0.985507 -10,5463 ролей,
0,9125 -10,5464 простой,
0.985507 -10.5464 сигналов
0,461783 -10,5467 индуцированный
0,695652 -10,5469 фраза,
0,627219 -10,548 модификаторов
0,6 -10,548 токенов,
0.985507 -10.5481 блоков
0,9125 -10,5482 функции функции
0,763158 -10,5484 ву
0,292092 -10,5486 прогноз
0,580808 -10,549 для обеспечения
0,453704 -10,5497 ранний
0,660131 -10,5498 тема
0,857143 -10,5501 39
0,653846 -10,5501 поддерево
0,35687 -10,5502 ч
0,9 -10,5505 объявления
0,1

-10,5509 6
0,570732 -10,5512 смена
0,728 -10,5513 75
0.763158 -10,5515 с направляющими
0,171441 -10,553 +
0,855556 -10,5538 шире
0,985294 -10,5538 SSL
0,498127 -10,5541 шаблонов
0.505792 -10.5558 против
0,737705 -10,556 (чианг,
0.412821 -10.5566 выпуск
0,464286 -10,5566 целевой язык
0,767857 -10,558 транспортировать
0,934211 -10,558 54
0,911392 -10,5582 я
0,824742 -10,5582 форм,
0,366397 -10,5582 ограничение
0,985294 -10,5584 70%
0,634146 -10,5585 узнавающий
0,6

-10,5586 пог.
0,628743 -10,5586 семь
0,745763 -10,5586 интуитивно понятный
0,651613 -10,5597 ит,
0,713178 -10.5598 вставка
0,745763 -10,5608 количественный
0.559242 -10.5614 кодировка
0.586387 -10.5616 миль
0,

5 -10,5617 инициализация
0,761062 -10,5619 краудсорсинг
0,204301 -10,5623 в пределах
0,370833 -10,5627 записей
0,933333 -10,5628 служит
0,465347 -10,5629 внутренний
0,25 -10,5633 вывод
0,31938 -10,5635 твитов
1 -10,564 наоборот.
0,933333 -10,5642 разбор зависимостей,
0,639752 -10,5648 делает
0,816327 -10,565 урду
0.765766 -10.5673 предыдущая работа над
0,547945 -10,5675, потому что они
0,360396 -10,5676 структурированный
0.783019 -10,5677 слабое
0,699248 -10,5681 л.
0,503876 -10,5686 подходов.
0.853933 -10.5686 проверен
0,911392 -10,5687 таблицы фраз
0,922078 -10,5689 испытаний
0.853933 -10.5691 удалено.
0,621302 -10,5691 фонетический
0,971014 -10,5702 судьи-люди
0,872093 -10,5704 46
0,9 -10,5 707 жестов
0,945205 -10,5711 неделя
0,777778 -10,5711 онтологий
0.796117 -10.5712 продуктов
0,273455 -10,5714 морфологический
0,553991 -10,5717 приобретение
0,520833 -10,5723 ограниченный
0,346863 -10,5724 исследования
0,945205 -10,5729 маркированный
0.410853 -10,5734 Стэнфорд
0,72 -10,5738 ассоциаций
0,783019 -10,5747 консенсус
0,441441 -10,5748 становится
0,985075 -10,5753 шаблонов.
0,985075 -10,5755 женский
0,862069 -10,5756 молодой
0,985075 -10,5757 рисунок
0.985075 -10.5759 капитализация
0,418919 -10,5767 байесовский
0,348231 -10,5767 переход
0,758929 -10,5772 заземление
0,8

-10,5781 видео
0,668966 -10,5785 пробелов
0,788462 -10,5787 голов
0,829787 -10,5792 максимальное
1 -10.5792 строение.
0,910256 -10,5794 коэфф.
0,540541 -10,58 составляющих
0.932432 -10,5804 зависимости,
0,546296 -10,5804 широкий
0,747826 -10,5805 извлечение правил
0,551887 -10,5808 пространственный
0,560976 -10,5808 средний
0,336842 -10,5808 сопутствующие работы
0,53304 -10,5812 Джон
0,788462 -10,582 факторизация
0,546296 -10,5824 предполагают, что
0,944444 -10,5832 динамика
0,710938 -10,5833 представление,
0,944444 -10,5834 веб-шкала
0,447205 -10,5837 прилагательных
0.295148 -10.5838 потенциал
0,710938 -10,584 преобразований
0,63522 -10,584 для классификации
0,8 -10,5843 качество перевода.0,653333 -10,5845 магазин
0,33107 -10,5845 расширенный
0,984848 -10,5858 устраняющий
0,641026 -10,5859 ∼
0.546296 -10.5869 оценок
0.821053 -10.5872 отличаются от
0,888889 -10,5872 4,5
0,510121 -10,5874 мерт
0,63522 -10,5874 записей
0,624242 -10,5874 достижение
0.22265 -10.5875 ошибок
0,741379 -10,588 алгоритмов,
0,860465 -10,5881 позиционный теггер
0,984848 -10,5883 сработало
0,673759 -10,5883 более общие
0,852273 -10,5884 интегрировано в
0,984848 -10,5888 дубликат
0,984848 -10,5891 частота,
0,688889 -10.5905 майкл
0,508065 -10,5907 направлено
0,189568 -10,5907 простой
0,407792 -10,5909 сообщений
0,957143 -10,5911 принципов
0.373102 -10.5912 ссылка
0,835165 -10,5916 постобработка
0,0965678 -10,5921 1
0,433628 -10,5923 синтаксического анализа
0,649007 -10,5928 канонический
0,909091 -10,5929 подразумевают
0,852273 -10,5929 маркировка
0,659864 -10,593 синтаксически
0,636943 -10,5932 включен
0,444444 -10,5935 г.
0,422969 -10,5937 пол
0,279268 -10,5939 основание
0,659864 -10,594 ограничения
0,620482 -10,5943 дэвид
0,476868 -10.5943 документа,
1 -10,5947 операций.
1 -10,5947 техника.
0,5 -10,5948 десять
0,703125 -10,595 черный
0,572165 -10,5957 γ
0,842697 -10,5958 наречий
0,943662 -10,5959 сверстников
0,253266 -10,596 поколения
0,909091 -10,5961 спаренный
0,575916 -10,5962 экстрактов
0,827957 -10,5964 переменных,
0,761468 -10,5965 возможно,
0,536036 -10,5966 пар слов
0,63871 -10,5971 подряд
0,467354 -10,5971 бесплатно
Стоит отметить 0,984615 -10,5972
0,556098 -10,5975 кадров
0,786408 -10,5977 внешнее
0,878049 -10,5979 исключить
0.731092 -10,5983 постановлений
0,984615 -10,5984 разреженность
0,943662 -10,5986 участвуют в
0,75 -10,5988 человеческих суждений
0.761468 -10.5988 вики
0,931507 -10,5994 пробная
0,544186 -10,5994 золотой стандарт
0,756757 -10,5996 редко
0,850575 -10,5997 пределы
0,678832 -10,6002 не имеет
0,773585 -10,6002 способствуют
0,984615 -10,6006 слоев
0,388095 -10,6015 как показано на
0,984615 -10,6016 логических форм
0,984615 -10,6017 ненулевое значение
0,441358 -10.6021 английский,
0,703125 -10,6021 2000
0,956522 -10,6022 ложных срабатываний
0.715447 -10.6031 и лапата,
0,73913 -10,6033 щелчка
0.970149 -10.6035 антецеденты
0,931507 -10,6036 продуктивный
0,878049 -10.6038 пол,
0.608187 -10.6041 день
0,640523 -10,6056 предположительно
0,984615 -10,6063 совпадений
0.664336 -10.6064 решение
0.819149 -10.6067 глубже
0.686567 -10.6068 с маркировкой
0,819149 -10,607 человек
0,984615 -10,6072 78
0,706349 -10,6073 унифицированный
0.116959 -10.6074 немного
0,728814 -10.6074 многозначный
0.743363 -10.6076 обмен
0.339416 -10.6079 twitter
0,678832 -10,6084 фразовый перевод
0.858824 -10.6086 разговорный язык
0,984615 -10,6086 слабо
0,833333 -10,6086 состояний,
0,930556 -10,6096 покрытие,
0.689394 -10.6096 раздел 5.
1 -10,6 · 105 критериев.
0,858824 -10,6106 svms
0,766355 -10,6108 подслово
0.804124 -10.611 орфографический
0,706349 -10,6112 показано как
0,587912 -10,6119 изготовитель
0,817204 -10,6122 дня
0.625 -10.6124 дата
0,747748 -10,6138 скрытых марков
0.580645 -10.6139 новостная лента
0,817204 -10,6141 регионов
0,907895 -10,6144 хранения
0,942857 -10,6145 правильно сформированный
0.676471 -10.6147 коллекций
0.955882 -10,6147 кванторы
0,876543 -10,615 игнорируется
0.502024 -10.6153 немного
0,795918 -10,6154 информатика,
0,955882 -10,6155 цитирования
0,886076 -10,6156 сценариев
0,341418 -10,6156 убыток
0,984375 -10,6159 преобладают
0,984375 -10,6161 однозначно
0,930556 -10,6162 без ограничений
0,776699 -10,6164 умирают
0,743363 -10,6175 завершено
0.695312 -10.6188 участок
0,570681 -10,6188 существенно
0,57754 -10,6189 т.е.
0,695312 -10,619 сила
0.984375 -10.6192 время выполнения
0,687023 -10,6195 вторичный
0,824176 -10.6196 решено
0,810526 -10,6197 достоверно
0,984375 -10,6198 групп,
0,984375 -10,62 арг. Макс.
0,984375 -10,6201 1997),
0,984375 -10,6204 хорошо известный
0.610778 -10.6205 схемы
0.457912 -10.6208 отзывов
0,776699 -10,6209 пила
0,984375 -10,6209 скромный
0,655172 -10,6215 как показано в таблице
0,984375 -10,6219 декларативная
0,929577 -10,622 дает нам
0,984375 -10,6222 отвечает за
0,382075 -10,6223 выходов
0,776699 -10,6232 xml
0,917808 -10,6238 (по
0,906667 -10,6238 меньше, чем
0,60355 -10,6244 дерева,
0,752294 -10.6249 два основных
0,657343 -10,6254 риторический
0,747748 -10,6255 википедия,
0,896104 -10,6255 точность, отзыв
0,650685 -10,6257 ключевых слов
0,875 -10,6257 определяется как:
0,942029 -10,6258 сообщений.
0.969231 -10.6261 объявление
0,984375 -10,6261 вероятностная масса
0,984375 -10,6262 посмотрел
0,362288 -10,6264, в частности,
0,622642 -10,6265 интерактивный
0,555 -10,6269 вместе
0,466431 -10,6273 вспомогательный
0,456081 -10,6277 1000
0.527027 -10.6278 ru
0,698413 -10,6282 нас интересует
0,757009 -10,6285 это
0,515021 -10.629 имели бы
0,657343 -10,6291 языковая модель,
0,144697 -10,6294 5
0,370536 -10,6294 эти два
0,646259 -10,6295 ограничено
0,745455 -10,63 выше
0,942029 -10,6305 бинаризация
0,793814 -10,6306 означает, что
0.256111 -10.6308 наименование
0,917808 -10,6313 1,2
0,506276 -10,6316 обобщенный
0,984127 -10,632 возможность
0,793814 -10,6322 открытый
0,787879 -10,6323 предложения)
0,917808 -10,6324 фи
0,61875 -10,6325 нграмм
0,44918 -10,6325 аспектов
0.955224 -10.633 удалено
0,587571 -10,6334 пропбанк
0,6 -10.6335 побудить
0,761905 -10,6335 тыс.
0,917808 -10,6347 повторных заказов
0,681818 -10,6347 определенный
0,955224 -10,6353 60%
0,469314 -10,6357 с аннотацией
0,929577 -10,6357 поза
0,793814 -10,636 wordnet,
0,984127 -10,6361 экспонатов
0,730435 -10,6363 вопросов,
0,648276 -10,6363 логика
0,

5 -10,6365 найдено,
0,929577 -10,6365 нечасто
0,402116 -10,6368 неизвестно
0,613497 -10,6369 (8)
0,984127 -10,6371 вывод
0,984127 -10,6371 возможности
0,822222 -10,6374 42
0,354639 -10,6375 регрессия
0,477612 -10.6376 оценить
0,984127 -10,6378 мс
0.60479 -10.6382 предложения
0,793814 -10,6382 намного больше
0,984127 -10,6384 удалить
0.984127 -10.6385 промах
0,676692 -10,6385 предложный
0,591954 -10,6386 7.
0,701613 -10,6387 должно быть
0,276596 -10,6393 структуры
0,696 -10,6393 ячейки
0.984127 -10.6394 разработчика
0,522321 -10,6396 считается
0,864198 -10,64 начальной загрузки
0,565445 -10,6405 дерево зависимостей
0.864198 -10.6407 кто-нибудь
0,738739 -10,6414 переведено на
0.984127 -10.6416 использует
0,75 -10,6417 (где
0.714286 -10.6418 рисунок 3.
0,873418 -10,6423 поиск луча
0,894737 -10,6424 млн. Тур.
0,692913 -10,643 наша цель —
0.317355 -10.643 парсеры
0,954545 -10,643 предварительные эксперименты
0.983871 -10.6431 указал
0,176561 -10,6433 после
0,469091 -10,6434 адаптировано
0,407104 -10,6436 границы
0,657143 -10,6437 выражая
0,717949 -10,6443 1-лучшая
0,470803 -10,6454 теория
0,495935 -10,6454 символа
0,419075 -10,6457 трудоустройство
0,941176 -10,6457 прогноз,
0,699187 -10,6457 значительное улучшение
0,664234 -10.6459 стохастик
0,928571 -10,6462 шт.
0,772277 -10,6463 терминология
0,405995 -10,6463 перекрытие
0,559585 -10,6464 строгий
0,983871 -10,647 трансдукции
0.893333 -10.6471 статистика.
0,415954 -10,6471 снова
0,772277 -10,6473 с перегибом
0,983871 -10,648 в широком смысле
0,520179 -10,6481 учится
0,556122 -10,6481 таблица 2 показывает
0.666667 -10.6488 раздел 3.
0,853659 -10,6492 и др.
0,983871 -10,6494 исключительно
0,621795 -10,6494 кривые
0,941176 -10,6503 47
0,845238 -10,6503 сжатия
0.941176 -10.6504 баз.
0,415473 -10.6506 аффект
0,983871 -10,6508 теги части речи
0,983871 -10,6511 подчеркнуть
0,219649 -10,6516 дискурс
0,357294 -10,6517 с точностью
0,627451 -10,6518 лингвистически
0,797872 -10,6518 предложение
0,845238 -10,6518 обычная
0,797872 -10,6519 за исключением того, что
0,983871 -10,653 шум,
0,345924 -10,6531 конструкция
0,34104 -10,6531 зависимости
0,941176 -10,6531 показаний
0,633333 -10,6532 ожидание
Проект 0.983871 -10.6537,
0,983871 -10,6538 0 0 0.
0,983871 -10,6544 косвенно
0,218427 -10,6549 7
0,445545 -10.655 транслитерация
0.813187 -10.6552 неродной
0,777778 -10,6554 сцены
0,547264 -10,6554 кларка
0.608696 -10.6555 перевести
0,983871 -10,6557 группа,
0,915493 -10,6557 временная сложность
0,645833 -10,6558 т.
0,248205 -10,6562 категория
0,504237 -10,6567 машинный перевод.
0,725664 -10,6569 неоднозначности
0,915493 -10,6569 ничего
0,661765 -10,6569 гаитян
0,629139 -10,657 элементарный
0,759615 -10,6571 суб
0.721739 -10.6592 относительно
0,789474 -10,6596 относительно
0,6 -10,66 фургон
0,811111 -10,6611 при условии, что
0.383292 -10,6613 (и
0,635135 -10,6614 книги
Порядок 0.702479 -10.6615,
0,647887 -10,6623 мультимодальные перевозки
0,835294 -10,6626 отражающий
0,587209 -10,6626 взаимная информация
0,881579 -10,6631 инкрементальный
0,541872 -10,6633 аксиомы
0,968254 -10,6634 факторов,
0,610063 -10,6634 i.
0,329091 -10,6634 для определения
0.983607 -10.6634 новостной комментарий
0,927536 -10,664 когда-либо
0,715517 -10,664 совместное обучение
0,927536 -10,6651 психологический
0,613924 -10,6653 (см. Таблицу
0,983607 -10,6654 дискриминация
0,983607 -10,6656 74
0.983607 -10,6657 экстенсивно
0.518018 -10.6657 рекомендации
0.940299 -10.6661 синхронизация
0,953846 -10,667 ортогональный
0,745283 -10,6671 вес элементов
0.475285 -10.6672 объяснить
0,579545 -10,6672 примера,
0,818182 -10,6673, предполагая, что
0.583815 -10.6674 предсказывает
0.983607 -10.6674 аннотаторов,
0.881579 -10.6674 опущено
0,953846 -10,6681 предыдущая работа,
0,671756 -10,6683 обратная
0,715517 -10,6684 расшифровка
0.568306 -10.6688 набор данных.
0.542289 -10.6692 маркированные данные
0,705882 -10,6696 первоначально
0,983607 -10.6696 символических
0,557895 -10,6701 каждый из них
0,851852 -10,6706 коннотативный
0,818182 -10,6707 тц
0,235294 -10,6708 /
0,983607 -10,671 пропорции
0,620915 -10,6711 чистый
0,983607 -10,6717 буфер
0,691057 -10,6718 языковая технология
0.579545 -10.6719 в сторону
0,679688 -10,6719 изменение
0.843373 -10.6719 звонков
0,953846 -10,6731 фонологический
0,523148 ​​-10,6732 чжан
0,926471 -10,6733!
0,542289 -10,6734 вариации
0,983607 -10,6736 кун
0,860759 -10,6736 т систем
0,860759 -10,6746 тематическое моделирование
0,843373 -10.6746 сохранить
0,983607 -10,6749 66
0.301075 -10.675 прогнозируемый
0.983607 -10.6751 местоимений,
0,5311 -10,6752 (Коэн и др.,
0.186761 -10.6758 автомат
0,914286 -10,6765 форма
0,914286 -10,6768 обучение
0,818182 -10,6769 триграмм
0.825581 -10.677 обнаружение ошибок
0,87013 -10,677 движение
0,298485 -10,6777 полярность
0,78125 -10,678 тыс.
0,767677 -10,6784 обучение без учителя
0,468165 -10,6791 степень
0,628378 -10,6791 глядя на
0,634483 -10,6794 присвоения
0,5 -10,6796 нам нужно
0.64539 -10.6797 создано
0.5 -10,68 срл
0,773196 -10,6802 на стороне источника
0,694215 -10,6805 κ
0,562162 -10,6806 подходов,
0,677165 -10,6808 грамматичность
0,8 -10,6809 эксп.
0,983333 -10,681 выделенный
0,266344 -10,6814 определенный
0,685484 -10,6819 (если
0,41994 -10,682 лучше
0,833333 -10,6824 доказательство
0,233055 -10,6827 токенов
0,694215 -10,6827 собрать
0.767677 -10.6832 реализовать
0,585799 -10,6833 по всем
0,802198 -10,6834 формально
0,85 -10,6836 (Клейн и
0,416667 -10,6838 итераций
0.52093 -10.6838 модификация
0.983333 -10,6839 постепенно
0,397297 -10,6844 ил.
0.504348 -10.6844 морфология
0,455516 -10,6854 она
0,983333 -10,6856 недостаточно
0,54 -10,6859 числовой
0,438944 -10,6863 24
0,773196 -10,6867 действительно
0,983333 -10,6869 участие
0.630137 -10.6871 телефон
0,299383 -10,6874 вероятностный
0,720721 -10,6876 лук
0,368298 -10,6879 интерпретация
0,324275 -10,6879 сплит
0,967742 -10,6881 ответил
0,983333 -10,6886 деревьев решений
0,983333 -10,6896 сегмент.
0.473077 -10.6898 предыдущая
0,559783 -10,6907 сл
0.983333 -10,6908 страдают от
0,88 -10,691 пантель,
0.793478 -10.6912 лексические ресурсы
0,461255 -10,6913 сегментов
0,773196 -10,6913 рейтинг страницы
0.649635 -10.6916 кб
0,938462 -10,692 сообщения,
0,671875 -10,6924 (п 0
0,925926 -11,5862 аксиомы вывода
0,523256 -11,5862 правда
Только 0,448276 -11,5865.
0,789474 -11,5866 35%
0,896552 -11,5866 ходунки
0,459459 -11,5866 наших
0,612903 -11,5866 демонстрирует, что
0,471698 -11,5867 мы протестировали
0,96 -11,5867 (дано
0,57971 -11,5867, что:
0.0470281 -11.5869 все
0,132396 -11.587 выбрано
0.577465 -11.587 для проверки
0,96 -11,5872 однородность
0.925926 -11.5873 позволил нам
0,896552 -11,5874 путей,
0,96 -11,5875 глав
0,702128 -11,5877 отношения между
0.96 -11.5878 модели;
0.96 -11.5878 обменов
0,96 -11,5878 напоминает
0,5 -11,5878, что означает
0,96 -11,588 референтов
0,870968 -11,5881 значения параметра
0.654545 -11.5881 рекомендация
0,96 -11,5882 левин
0,96 -11,5886 согласен с
0,96 -11,5891 руб.
0,96 -11,5892 зарегистрировано
0,96 -11,5892 больше,
0.320175 -11.5893 диалог
0.896552 -11,5895 fo
0,769231 -11,5897 шт.
0,96 -11,5898 примечание, однако,
0.96 -11.5899 рендеринг
0,823529 -11,59 легкие глаголы
0,823529 -11,5902 низший
0,370588 -11,5902 эл.
0,264095 -11,5902 эффектов
0,445378 -11,5904 (мы
0,361111 -11,5905 клейн
0,654545 -11,5905 этот эксперимент, мы
0,96 -11,5906 прогрессивный
0,96 -11,5907 16%
0,896552 -11,5909 перекрестная проверка
0,413043 -11,591 (2008),
0.805556 -11.591 кбит
0.96 -11.5911 просмотр
0,96 -11,5911 на основе памяти
0,317597 -11,5912 требуется для
0,96 -11.5913 извлечение (т.е.)
0,363636 -11,5914 гиза ++
0,96 -11,5915 интерпретаций,
0,3125 -11,5916 обучение.
0,642857 -11,5916 смежность
0,870968 -11,5917 церковь
0,738095 -11,5917 видимый
0,727273 -11,5919 землетрясение
0,738095 -11,592 (ж)
0,96 -11,5922 теги части речи,
0,96 -11,5922 встречается одновременно
0,96 -11,5922 синтаксико-семантический
0,769231 -11,5924 маршрут
0,896552 -11,5924 родственные,
0,6 -11,5924 чжан,
0,756098 -11,5925 (2003).
0,612903 -11,5925 выпускник
0.702128 -11.5928 сделок
0,96 -11,5929 номиналов
0,870968 -11.593 350
0,68 -11,5932 жирным шрифтом.
0,205776 -11,5932 в сторону
0,96 -11,5933 биомолекулярный
0,96 -11,5934 пустой,
0,727273 -11,5935 hoc
0,68 -11,5936 чан.
0,756098 -11,5936 принуждение
0,96 -11,5937 мос,
0,480392 -11,5939 для оценки
0,115604 -11,5939 диалог
0,544304 -11,5939 чернослив
0,423077 -11,594 2001)
0,673077 -11,5941 сюрприз
0,896552 -11,5941 (n =
0,896552 -11,5941 французский – английский
0,727273 -11,5942 со
0,896552 -11,5944 (1993)
0,327189 -11,5944 кажется
0,96 -11,5944 мониторинг
0,96 -11,5947 дк
0.896552 -11,595 csd
0,405594 -11,5951 глагол.
0,96 -11,5951 голос,
0,896552 -11,5953 0,28
0,96 -11,5953 пробелов,
0,96 -11,5953 55%
0,84375 -11,5957 мультимедиа
0.896552 -11.5959 перечислить
0,823529 -11,5962 правила перефразирования
0,96 -11,5963 успеха,
0.96 -11.5964 открытие
0,96 -11,5964 словаря
0,96 -11,5966 постоянно
0,96 -11,5967 часто,
0,96 -11,5968 да,
0,96 -11,5968 обеспечивает
0,642857 -11,597 пропущено
0,187406 -11,597 2,
0,96 -11,5971 доставлено
0,96 -11,5973 (исходный)
0,727273 -11,5974 Палмер
0.68 -11,5974 явления,
0,357143 -11,5977 исследовано
0,96 -11,5977 мультимодальный
0,727273 -11,5981, чтобы преодолеть это
0,267692 -11,5981 модель перевода
0,96 -11,5982 многомерный
0,6 -11,5986 непересекающийся
0,896552 -11,5987 телевизор
0,410072 -11,5988 для создания
0,96 -11,5989 ср,
0,96 -11,599 динамическое программирование
0,896552 -11,5991 резка
0,96 -11,5997 информационный
0,769231 -11,6001 увеличение
0,590909 -11,6001 Маккеун,
0,590909 -11,6002 смт.
0,84375 -11,6004 процедура вывода
0,783784 -11,6005 ->
0,334951 -11.6007 цифра 3
0.96 -11.6007 визуализировать
0,642857 -11,6008 квадрат6
0,296578 -11,6009 примеров.
0.823529 -11.601 классификация настроений.
0,84375 -11,601 iq
0.925926 -11.6011 сгруппированы в
0,419847 -11.6011 алгоритм 1
0.711111 -11.6011 доказывает
0,68 -11,6013 180
0.96 -11.6013 просмотр
0,866667 -11,6016 замечательно
0.896552 -11.6018 распознает
0.517241 -11.6018 переупорядочен
0,187879 -11,6019 высказываний
0.896552 -11.602 доступ
0,642857 -11,602 microsoft research
0,866667 -11,6021 частицы
0.96 -11.6022 растворы,
0.805556 -11.6022 га
0,866667 -11,6024 актер
0,96 -11,6027 очищено
0,823529 -11,6028 голый
0,96 -11,6029 передает
0,925926 -11,6031 (18)
0,896552 -11,6031 усреднено по
0.96 -11.6031 материал,
0,727273 -11.6032 двухступенчатый
0,96 -11,6033 (исходный
0,96 -11.6034 синтаксико-семантический
0,96 -11,6034 запятые
0,783784 -11.6034 извлечено из
0,96 -11,6037 желание
0,631579 -11,6037 мс
0,96 -11,6038 афазия
0,530864 -11.6038 петров
0,96 -11,604 разборчивость
0.404255 -11.6041 гид
0,96 -11,6041 немного,
0,648148 -11.6042 75%
0,896552 -11,6043 1,0.
0.603175 -11.6043 заглавное слово
0.896552 -11.6045 lda.
0,783784 -11,6048 или нет,
0,96 -11,6049 м и л
0,96 -11,6052 виттен,
0,96 -11,6055 2 пар
0,96 -11,6057 итерация
0.96 -11.606 зарезервировано
0,616667 -11,606 $
0,218557 -11,6061 принимая
0.96 -11.6061 подтверждено
0,642857 -11,6061 реверберация
0.438017 -11.6062 предлагает
0.866667 -11.6063 физика
0,925926 -11,6064 базовый уровень:
0.96 -11.6064 писатель
0.925926 -11.6071 системный уровень
0,96 -11.6071 семевал-2007
0,642857 -11,6071 кларк,
0,96 -11.6075 многоточие
0,0296535 -11.6077 это
0.925926 -11.6079 лучшая производительная система
0,96 -11,6079 игры,
0,823529 -11,608 вкладов.
0,96 -11,6083 рафинирование
0,866667 -11.6084 отображение,
0.866667 -11.6084 иронический
0,96 -11,6085 запомнить
0.96 -11.6088 научных статей
0,648148 -11,6088 предположим, что
0.96 -11.6089 кто угодно
0,96 -11,609 процесс
0.892857 -11.609 потенциально может
0.769231 -11.6091 скобки
0,75 -11.6092 запрос
0,96 -11,6092 альфа
0,96 -11,6092 предложения
0,571429 -11,6093 до длины
0,711111 -11.6094 2005, г.
0.823529 -11.6097 логика,
0,8 -11,6101 максимальное ожидание
0,257143 -11,6103 широко
0,642857 -11,6103 высокая точность
0,48 -11,6104 Кендалла
0,8 -11,6105 лави
0,8 -11,6106 сегмент,
0,96 -11,6 · 107,
0,925926 -11,6108 тер (snover
0,177112 -11,6108 л
0,96 -11,611 (каждый
0,258721 -11,6111 встречается
0.96 -11.6117 лотов
0,8 -11,6117 контакт
0,866667 -11,6118 мкм
0.96 -11.6118 предварительная обработка,
0,96 -11,6122 слушать
0.8 -11.6122 дательный падеж
0.84375 -11.6123 как можно скорее
0,136731 -11,6124 шаг
0,378882 -11.6124 4,4
0,711111 -11,6127 корпус параллельный,
0,96 -11,6128 чункеров
0,96 -11,6129 магистраль
0,96 -11,613 с @ 1
0,24173 -11,613 звонка
0,738095 -11,6131 подход:
0.866667 -11.6131 псевдоним
Выбрано 0,530864 -11,6132
0,590909 -11,6133 тензор
0,84375 -11,6136 λ1
0,783784 -11,6136 (пун
0,376543 -11,6136 возможно.
0,475248 -11,6137 (2001)
0,96 -11,6137 (п)
0,96 -11,6139 формальное определение
0,823529 -11,614 часть речи
0,75 -11,614 распределительная семантика
0,866667 -11,6141 идентичны,
0,96 -11,6142 куб. Фут
0,8 -11.6145 венгерский
0,8 -11,6148 представлений функций
0,447368 -11,6149 кластеров,
0,75 -11,6149 подтверждают, что
0,413534 -11,6149 обычно
0,156051 -11,615 г.
0,738095 -11,6152 учебный экземпляр
0,923077 -11,6154 благоприятно
0,84375 -11,6155 t-балл
0,96 -11,6155 ошибочно
0,280822 -11,6156 наличие
0.505618 -11.616 наша модель.
0,923077 -11,6161 линия,
0.892857 -11.6162 предварительный заказ
0,631579 -11,6162 0,81
0,75 -11,6164 очень хорошо
0,84375 -11,6168 объем работ
0,84375 -11,6169 twss
0,923077 -11,617 лог-линейный
0.6875 -11,6173 ищем
0,711111 -11,6177 пространственная информация
0,923077 -11,6178 обучение:
0,866667 -11,6179 фоновые знания
0.648148 -11.6179 синтаксис.
0,923077 -11,618 впечатляет
0,923077 -11,618 мелкозернистый
0,84375 -11,6181 пар
1 -11.6181 удерж.
1 -11,6181 рис.
1 -11,6181 2.1.
1 -11.6181 замена.
1 -11,6181 выровнено.
1 -11,6181 оценок.
1 -11,6181 скобки.
1 -11,6181 кн.
1 -11.6181 особенности).
1 -11,6181 минут.
1 -11,6181 соответствующий.
1 -11.6181 ид.
1 -11,6181 морфемы.
1-11.6181 поток.
1 -11,6181 вариации.
1 -11.6181 дель рей,
1 -11,6181 (3).
1 -11,6181 зависимость.
1 -11.6181 приоры.
0,958333 -11,6183 ibm модель-1
0,475248 -11,6183 анализатор
0,923077 -11,6184 оспорено
0,436975 -11,6186 п =
0.666667 -11.6188 эта проблема.
0,427419 -11,6188 попыток
0,462264 -11,6189 исключено
0,958333 -11,6191 встречающиеся в природе
0,783784 -11,6193 «как
0,738095 -11,6196 начать с
0,892857 -11,6198 при совместном размещении
0,783784 -11,6199 ‘до
0,52439 -11,6207 в упаковке
0,8 -11,6208 d2
0,84375 -11,6209 исх.
0.208333 -11.6211 описывает
0,484536 -11,6213 осмотр
0,616667 -11,6213 лу
0,62069 -11,6219 необходимо.
0,5 -11,6219 цифровой
0.62069 -11.6222 реализация,
0.56338 -11.6223 моделировать
0,958333 -11,6225 с арабского на английский
0,866667 -11,6226 0,32
0,711111 -11,6228 авто
0,178025 -11,6228 баллов
0,305785 -11,6229 сокращает
0,8 -11,623 для этого,
0,695652 -11,6231 0,54
0,923077 -11,6231 трюк
0,783784 -11,6233 мВт.
0.631579 -11.6235 задача:
0,818182 -11,6237 0,17
0,249315 -11,6238 точность.
0,958333 -11,624 цветных
0.866667 -11,624 ядра
0,923077 -11,6243 лус
0,554054 -11,6244 м,
0,958333 -11,6247 на векторной основе
0,958333 -11,6247 работа:
0.923077 -11.6248 группы:
0,958333 -11,625 ведет нас
0.8 -11.6252 версия,
0.763158 -11.6255 отвечает
0,866667 -11,6256 92%
0,364706 -11,6257 2000).
0.554054 -11.6258 падает
0,695652 -11,6258 может захватывать
0,892857 -11,6258 эти результаты предполагают
0,763158 -11,626 кол-во
0,573529 -11,6262 магазина
0,666667 -11,6263 наши эксперименты показывают
0,892857 -11,6266 wl
0,892857 -11,6267 одиннадцать
0,958333 -11.6268 Осборн,
0,958333 -11,6268 дополнено
0,151822 -11,6269 эксперимент
0.205993 -11.6273 оценочно
0,958333 -11,6274 параллелизм
0.673469 -11.6274 расположение.
0,454545 -11,6275 семян
0,958333 -11,6278 бактерий биотоп
0,364706 -11,628 состоит из
0,0882555 -11,6282 балла
0,958333 -11,6285 отношения между
0,958333 -11,6285 альтернатив,
0,555556 -11,6285 заметность
0,283688 -11,6287 крест
0.763158 -11.6287 п.
0,866667 -11,6287 маржа.
0,631579 -11,6287 твердый
0,818182 -11,6288 усл.
0,554054 -11.6288 этот выпуск
0,958333 -11,6291 наведение
0,21371 -11,6291 разрешение
0,958333 -11,6292 раскрытие
0,958333 -11,6293 скорость разговора
0.56338 -11.6293 написано
0,866667 -11,6296 ч3
0,923077 -11,6297 неизвестно.
0,554054 -11,6298 полезно для
0,923077 -11,6298 111
0,19187 -11,6302 правый
0,763158 -11,6303 плодовитость
0,923077 -11,6306 определений,
0,137615 -11,6308 генерировать
0,892857 -11,6309 различить
0,923077 -11,631 f (x)
0,958333 -11,6312 обычная практика
0,958333 -11,6312 плиток
0,194305 -11,6312, имеющий
0.8-11.6312 последняя работа
0.226757 -11.6314 проверено
0,892857 -11,6314 г)
0,958333 -11,6315 (карлсон
0,958333 -11,632 неадекватно
0,958333 -11,6322 теоретико-информационная
0,439655 -11,6322 проведено
0,546667 -11,6322 необходимо для
0,892857 -11,6322 ши
0,923077 -11,6322 дочерняя
0.958333 -11.6323 20 групп новостей
0,958333 -11,6324 (бергсма
0,958333 -11,6324 itspoke
0,958333 -11,6324 2это
0.892857 -11.6324 совет
0,325472 -11,6325 получено
0,958333 -11,6327 частот,
0,268371 -11,6329 генерирует
0.958333 -11,633 самонастройки,
0,866667 -11,6331 аперций
0,75 -11,6332 химический
0,596774 -11,6332 соответствие.
0,101134 -11,6333 одиночный
0,72093 -11,6334 поощряет
0,75 -11,6335 т,
0,923077 -11,6335 пружина
0,958333 -11,6336 на основе истории
0,892857 -11,6336 убыток,
0,958333 -11,6341 DVD
0.818182 -11.6342 более ранняя работа
0,958333 -11,6344 Джонс
0,958333 -11,6346 полужирный
0,364706 -11,6346 матриц
0,308017 -11,6346 встречаются в
0,958333 -11,6348 повар
0,958333 -11,6348 лингвистически мотивированный
0,72093 -11,6349 вероятностные модели
0.958333 -11,635 перемычка
0,0810968 -11,6358 алгоритм
0,958333 -11,636 подсистема
0.59375 -11.636 дальнейшее улучшение
0,958333 -11,6361 цикла
0.72093 -11.6361 набор функций.
0,892857 -11,6361 143
0,958333 -11,6363 значений,
0,958333 -11,6363 мвус
0.72093 -11.6364 алгоритм, который
0,958333 -11,6367 помещений
0,958333 -11,6367 внутренне
0,818182 -11,6368 эрик
0,763158 -11,6368 подстроки
0,958333 -11,6371 рабочая
0,335 -11,6371 ∑
0,958333 -11,6374 сопоставимо,
0,8 -11,6374 эйн
0.958333 -11.6375 и выше,
0.289474 -11,6375 приближение
0,958333 -11,6378 артефакт
0,892857 -11,6378 Ирландия
0,866667 -11,6379 ситуаций,
0,573529 -11,638 рассчитано с использованием
0,923077 -11,6381 определение наличия
0,958333 -11,6382 1991;
0,442478 -11,6383 для анализа
0,818182 -11,6384 резервуар
0,573529 -11,6386 их работы
0,358382 -11,6388 стартов
0,83871 -11,6388 стандартных отклонений
0,8 -11,6392 сл.
0,958333 -11,6397 стоит
0.923077 -11.6397 организован в
0,958333 -11,6398 представлено,
0,417323 -11,6399 создает
0,958333 -11.6401 уровень:
0.958333 -11.6402 на основе правил
0,958333 -11,6402 боксер
0,32243 -11,6403 ни
0,958333 -11,6404 предприятия
0,731707 -11,6404 0,48
0,958333 -11,6405 в комплекте,
0,958333 -11,6406 капитализация,
0,958333 -11,6406 f1,
0,958333 -11,6409 non-asr
0,958333 -11,6409 однородный
0,958333 -11,6409 шторм дарпа
0,958333 -11,6412 подготовка данных
0,818182 -11,6418 классификация настроений,
0,8 -11,6419 асд
0,187994 -11,642 простой
0,372671 -11,6421 лист.
0,958333 -11,6422 id,
0,958333 -11,6424 радость
0.958333 -11,6425 формул
0,958333 -11,6425 делит
0,958333 -11,6426 драматический
0,539474 -11,6431 коо
0,958333 -11,6432 дельта
0,958333 -11,6433 монода
0,958333 -11,6435 таблица 2 списков
0,610169 -11,6435 левый
0,105473 -11,6435 секунды
0.42623 -11.6436 проведено
0,32243 -11,6437 адресовано
0,236181 -11,644 получено
0,653846 -11,644 не удалось
0,958333 -11,6441 частичный синтаксический анализ
0,958333 -11,6441 сегментов,
0,109043 -11,6443 извлечено
0,293436 -11,6444 0.
0,72093 -11,6444 р.,
0,958333 -11,6445 выгодно
0.24147 -11,6445 α
0,958333 -11,6446 (в)
0,5 -11,6447 со-ссылка
0,565217 -11,6448 состояние,
0,958333 -11,6449 я-1
0,2173 -11,645 3,
0.958333 -11.6451 заклинание
0,575758 -11,6451 метка класса
0,958333 -11,6452 убытки
0,892857 -11,6454 байесовский вывод
0.892857 -11.6455 прага
0.83871 -11.6456 сообщил здесь
0,958333 -11,6458 опосредованный
0.596774 -11.6458 как объяснено
0,958333 -11,6459 подстановочные знаки
0,958333 -11,6462 эвристика,
0,958333 -11,6463 2,7
0,113755 -11,6464 высокая
0,958333 -11,6466 о (n2)
0,818182 -11.6466 наиболее подходящий
0,958333 -11,6475 сделано,
0,892857 -11,6478 наций
0,923077 -11,6478 т)
0,892857 -11,6479 си,
0,958333 -11,6482 рефератов,
0,294118 -11,6484 выполняем
0,518072 -11,6486 Хагиги
0,641509 -11,6487 два отдельных
0,731707 -11,6488 в среднем
0,958333 -11,6489 149
0,958333 -11,6491 поясняющий
0,958333 -11,6491 вопросно-ответный
0,958333 -11,6491 предикативный
0,731707 -11,6491 шт.,
0,958333 -11,6495 166
0.958333 -11.6495 (карта)
0,958333 -11,6495 (2011).
0,147783 -11,6495 означает
0,274576 -11.6496 разработчиков
0,923077 -11,6496 бразильский
0,958333 -11,6499 171
0,958333 -11,6501 корпус)
0,547945 -11,6501 sentiwordnet
0,958333 -11,6502 (набор
0,958333 -11,6504 1,5%
0,862069 -11,6504 2006,
0,958333 -11,6506 139
0,5 -11,6506 (коэн,
0,763158 -11,6507 уверенность.
0,279152 -11,6508 обучение.
0,958333 -11,6509 утверждений
0.958333 -11.6509 октябрь
0.557143 -11.6509 vb
0,818182 -11,651 номенклатура
0,483871 -11,6511 в наших экспериментах мы
0,958333 -11,6515 дочь
0,306383 -11,6516 легко
0,414062 -11,6516 уставка.0,731707 -11,6517 столбец показывает
0.222472 -11.6518 отмечен
0,958333 -11,6518 итерация
0.862069 -11.6519 раздел 5 представляет
0,83871 -11,6521 схема взвешивания
0.958333 -11.6522 метаграмма
0,958333 -11,6522 присоединения
0,457143 -11,6523 требование
0,133226 -11,6525 среди
0,958333 -11,6526 просто
0,958333 -11,6526 2.2.1
0,958333 -11,6528 диагноз
0,958333 -11,6528 человекоподобный
0,958333 -11,6528 курсив
0,888889 -11,653 млн
0,794118 -11,653 для размещения
0,958333 -11,6531 компромисс
0,958333 -11,6532 повторная реализация
0.862069 -11.6533 отчет о результатах на
0,958333 -11,6534 162
0,449541 -11,6534 Митчелл
0.268852 -11.6535 Сообщество
0.958333 -11.6537 платит
0,794118 -11,6537 добавлено
0,958333 -11,6538 поисковая система.
0,958333 -11,6539 по точкам
0,958333 -11,6539 топ-10
0,818182 -11,6539 пст.
0,565217 -11,654 корреспонденции
0,272727 -11,6542 (2005)
0,193878 -11,6543 настройка
0,958333 -11,6548 иллюстративное
0,958333 -11,6548 судья
0,345946 -11,6549 (ср.
0,680851 -11,6549 1994)
0,958333 -11,655 баллов,
0.958333 -11.655 загрузок
0.958333 -11,655 173
0,557143 -11,6551 рот
0,151295 -11,6552 корреляция
0,181682 -11,6553 вместе
0,862069 -11,6553 экстрактивное обобщение
0,958333 -11,6555 построено,
0,74359 -11,6556 юрафский,
0.237245 -11.6559 источников
0,376623 -11,6559 кривая
0,3125 -11,6564 наблюдения
0,958333 -11,6565 слм
0,958333 -11,6565 simstring
0,270903 -11,6565 не были
0,862069 -11,6567 импорт
0,958333 -11,6568 хотя,
0,958333 -11,6568 (потому что
0,862069 -11,6568 во многих случаях,
0,251429 -11,6569 отличается от
0.958333 -11,6573 предсказуемость
0,888889 -11,6576 статический кеш
0,135495 -11,6581 улучшение
0.505882 -11.6583 возникают
0,74359 -11,6583 лр
0,625 -11,6583 в этом исследовании
0,958333 -11,6584 панель
0,66 -11,6588 спирта
0,958333 -11,659 недоразумение
0,270903 -11,659 2004)
0,333333 -11,659 сценарий
0,958333 -11,6591 i0
0,127393 -11,6592 аннотация
0,66 -11,6592 с0
0,92 -11,6593 по существу,
0,283088 -11,6594 успешно
0.862069 -11.6594 ремонт
0,363636 -11,6597 половина
0,376623 -11,6604 сложный
0.414062 -11,6604 если есть
0.614035 -11.6605 url
0,958333 -11,6606 соответствующий,
Модель смеси 0,625 -11,6607
0.74359 -11.6609 расположен в
0,777778 -11,661 голдуотер
0.187801 -11.6611 сравнивая
0,547945 -11,6613 сохраняем
0,610169 -11,6613 би
0,704545 -11,6614 индуцированный от
0,66 -11,6618 переходов.
0,92 -11,6623 wn ++
0.505882 -11.6624 подробнее
0,777778 -11,6625 гос.
1 -11,6626 сокращение.
1 -11,6626 извлечено.
1 -11.6626 интернет.
1 -11,6626 шкал.
1 -11.6626 объяснение.
1 -11.6626 производство.1-11.6626 присвоено.
1 -11.6626 перефразирование.
1 -11,6626 отношения.
1 -11,6626 выгодно.
1 -11,6626 достигнуто.
1 -11,6626 т.е.
1-11.6626 поперечно-язычный
1-11,6626 шт.
1-11.6626 1990).
1-11.6626 модификаций.
1 -11,6626 ранг.
1 -11,6626 экземпляров.
1 -11.6626 кореферент.
1 -11,6626 предложений.
1 -11,6626 разнообразия.
1 -11.6626 исследовано.
1 -11,6626 сравни.
1 -11.6626 возраст.
1-11.6626 версий.
1 -11,6626 обнаружено.
1 -11,6626 экран.
0,74359 -11,6627 рельеф
0,862069 -11,6628 твит,
0.92 -11.6629 торговля
0.704545 -11.6629 сша.
0,625 -11,6629 гарантий
0.794118 -11.6629 выдает:
0,532468 -11,663 каждого человека
0.83871 -11.6631 самое раннее
0.6 -11.6631 в рейтинге
0,731707 -11,6633 инфинитив
0.92 -11.6633 моделирующий
0,956522 -11,6635 если есть,
0,74359 -11,6636 параметр,
0,92 -11,6636 эмпирически,
0,92 -11,6637 156
0,666667 -11,664 похищение
0,862069 -11,6641 семпоз
0,406015 -11,6642 ожидания
0,956522 -11,6645 тензорное произведение
0,666667 -11,6645 крайний левый
0,92 -11,6645 биграмм,
0,62963 -11.6645 статистических моделей
0,92 -11,6647 σ,
0,92 -11,6648 перл
0,92 -11,6648 сотрудников
0,92 -11,665 контекстная полярность
0,62963 -11,665 эмпирические результаты
0.5 -11.6651 вероятностная модель
0,641509 -11,6653 пол
0,704545 -11,6654 удаление
0,83871 -11,6657 с3
0,5 -11,6657 рассмотрим следующие
0,956522 -11,666 парный t-критерий
0,92 -11,6665 ср.
0,680851 -11,6665 матрица-пространство
0.525641 -11.6665 аннотаторов были
0,92 -11,6666 экстракция:
0,83871 -11,6666 возникающие
0,92 -11,6668 с2,
0,83871 -11,6668 указывает, есть ли
0.862069 -11.667 недавно предложено
0,92 -11,6671 хуже,
0.227488 -11.6672 технология
0,714286 -11,6672 вонга
0,83871 -11,6672 сен
0,74359 -11,6675 метафорический
0.92 -11.6676 прошивка,
0,956522 -11,6679 стиль письма
0.714286 -11.668 вопросов о
0,257669 -11,6682 эффект
0,549296 -11,6682 лян
0,956522 -11,6684 витка,
0.19646 -11.6684 объект
0,45283 -11,6685 увеличить
0,777778 -11,6687 новинка
0,794118 -11,6687 экспертов,
0.307359 -11.6687 читаемость
0,92 -11,6689 Intel
0.756757 -11.6691 тед
0.92 -11,6692 пробега,
0,0574018 -11,6692 другое
0,888889 -11,6694 чел.
0,888889 -11,6694 репликация
0,614035 -11,6695 одноязычные данные
0,794118 -11,6697 0,23
0,956522 -11,6698 сжатие
0,862069 -11,6699 отр.
0,293651 -11,6701 связывание
0,92 -11,6703 (функция
0,862069 -11,6704 рог
0.956522 -11.6705 cdec
0,956522 -11,6705 68,0
0.92 -11.6706 на основе синтаксиса
0,66 -11,6706 ху
0,956522 -11,6709 бьёрн
0,614035 -11,6709 предложение
0.756757 -11.6709 выше уровень
0,956522 -11,6712 метода
0,956522 -11,6712 на данный момент
0.124026 -11,6713 значительный
0,6 -11,6714 матч,
0,862069 -11,6715 прописные буквы
0,688889 -11,6716 жизненно важный
0,92 -11,6716 (2010), воз
0.956522 -11.6717 кеширование
0,525641 -11,6717 воз
0.888889 -11.6718 место
0,956522 -11,6721 неизбежно
0,714286 -11,6721 интенсивность
0,956522 -11,6722 рифма
0,92 -11,6723 25,
0,29249 -11,6727 итерация
0,956522 -11,673 33,3
0.74359 -11.673 построение графика
0,74359 -11,6731 падение
0.956522 -11.6733 для конкретного документа
0,5

-11,6735 раствор.
0,92 -11,6735 убито
0,92 -11.6735 зависимость от
0,888889 -11,6738 грипп
0,888889 -11,674 пбт
0,956522 -11,6741 заметно
0,3 -11,6741 (2004)
0,888889 -11,6744 тамильский
0.558824 -11.6745 намного ниже
0,956522 -11,6746 распространение ошибки
0,956522 -11,6747 тем не менее
0.182236 -11.6747 описание
0.956522 -11.6749 прицеливаясь
0,74359 -11,675 обещание
0,92 -11,6751 (20)
0,956522 -11,6756 подграфов
0,956522 -11,6756 граней
0,956522 -11,6759 должно
0.888889 -11.6759 вс
0,956522 -11,6763 бве
0,92 -11,6765 (т
0,92 -11,6766 аудитория
0,888889 -11.6767 интенсивный
0.92 -11.6768 расследование.
0,956522 -11,6769 сопоставлений
0,956522 -11,6772 инспектирующий
0,756757 -11,6772 в итоге,
0,549296 -11,6773 связи
0,956522 -11,6774 сегодня,
0.956522 -11.6778 построено,
0,956522 -11,678 урожайный
0,888889 -11,6782 каждый
0.956522 -11.6783 характеристики,
0,714286 -11,6783 словари,
0,166453 -11,6783 компонент
0,230769 -11,6785 шт.
0,956522 -11,6787 разное
0,956522 -11,6787 относительная статья
0,473684 -11,6787 увеличение
0,956522 -11,679 аз
0,92 -11.679 147
0,525641 -11,679 расход
0,888889 -11,6792 питман-йор
0,207171 -11,6792 незначительно
0,956522 -11,6793 древовидный
0,956522 -11,6794 т.е,
0,5

-11,6795 зависимость
0,3 -11,6795 оператор
0,956522 -11,6796 синтаксический / семантический
0,956522 -11,6796 изображают
0,8125 -11,6796 2007,
0,956522 -11,68 индомен
0,725 -11,68 106
0,394161 -11,6801 в конце
0.956522 -11.6802 опубликовать
0,8125 -11,6802 7)
0,725 -11,6803 вандервенде,
0,888889 -11,6805 69,2
0,956522 -11,6806 симметрично
0,756757 -11,6807 числовые выражения
0.221461 -11.6808 содержится
0,956522 -11,6809 ваниль
0,956522 -11,6811 случайный,
0.956522 -11.6811 другое
0,956522 -11,6812 18%
0,666667 -11,6812 0,5.
0.603448 -11.6812 чаще
0,956522 -11,6814 предельное
0,578125 -11,6814 предельное
0,725 -11,6814 проспект
0,0960549 -11,6814 имеем
0,833333 -11,6817 млн ​​руб.
0,956522 -11,6818 бустов
0,956522 -11,6819 продолжение
0,666667 -11,6819 мккал,
0,666667 -11,6819 личность
0.956522 -11.6821 rescore
0.956522 -11.6822 соревнуются
0,74359 -11,6822 добавка
0,714286 -11.6823 путь,
0,92 -11,6823 Wordnet Synset
0,569231 -11,6824 принципиальный
0.888889 -11.6826 визуализация
0,369427 -11,6826 приведены в
0,956522 -11,6827 фраменет,
0,956522 -11,6828 190
0,956522 -11,6828 коллапс
0,888889 -11,6829 длина описания
0,956522 -11,683 (чарняк
0,956522 -11,6831 потомков
0,794118 -11,6831 глаз
0,8125 -11,6831 фильтрация,
0,956522 -11,6833 стиль чтения
0.603448 -11.6833 опубликовано
0,421488 -11,6834 станков
0.888889 -11.6834 требования.
0,771429 -11,6838 специально
0,956522 -11.6839 сопровождающих
0.956522 -11.6839 скрытые переменные
0,956522 -11,6839 порционная
0.888889 -11.684 слышно
0,956522 -11,6845 титов
0,688889 -11,6845 выравнивает
0,714286 -11,6847, включающий
0,956522 -11,6848 (верх)
0,956522 -11,6849 п.

% PDF-1.4
%
1 0 объект
>
эндобдж
5 0 obj
>
эндобдж
2 0 obj
>
транслировать
2016-12-20T12: 28: 59 + 01: 002017-01-09T10: 22: 57 + 01: 002017-01-09T10: 22: 57 + 01: 00PlotSoft PDFill 12.0uuid: 6035d665-7d37-4602-a4c7-aa45c5023d11uuid : 73b82797-0cdb-46db-9194-ef58e411b6f1application / pdf

конечный поток
эндобдж
3 0 obj
>
эндобдж
4 0 obj
>
эндобдж
6 0 obj
>
эндобдж
7 0 объект
>
эндобдж
8 0 объект
>
эндобдж
9 0 объект
>
эндобдж
10 0 obj
>
эндобдж
11 0 объект
>
эндобдж
12 0 объект
>
эндобдж
13 0 объект
>
эндобдж
14 0 объект
>
эндобдж
15 0 объект
>
эндобдж
16 0 объект
>
эндобдж
17 0 объект
>
эндобдж
18 0 объект
>
эндобдж
19 0 объект
>
эндобдж
20 0 объект
>
эндобдж
21 0 объект
>
эндобдж
22 0 объект
>
эндобдж
23 0 объект
>
эндобдж
24 0 объект
>
эндобдж
25 0 объект
>
эндобдж
26 0 объект
>
эндобдж
27 0 объект
>
эндобдж
28 0 объект
>
эндобдж
29 0 объект
>
эндобдж
30 0 объект
>
эндобдж
31 0 объект
>
эндобдж
32 0 объект
>
эндобдж
33 0 объект
>
эндобдж
34 0 объект
>
эндобдж
35 0 объект
>
эндобдж
36 0 объект
>
эндобдж
37 0 объект
>
эндобдж
38 0 объект
>
/ XObject>
>>
/ Аннотации [274 0 R]
/ Родитель 13 0 R
/ MediaBox [0 0 595 842]
>>
эндобдж
39 0 объект
>
/ Ресурсы>
/ Шрифт>
/ ProcSet [/ PDF / Text]
/ Свойства>
/ XObject>
>>
/ Повернуть 0
/ Большой палец 308 0 R
/ TrimBox [8.50389 8,50391 1006,3 688,818]
/ Тип / Страница
>>
эндобдж
40 0 объект
>
эндобдж
41 0 объект
>
эндобдж
42 0 объект
>
эндобдж
43 0 объект
>
эндобдж
44 0 объект
>
эндобдж
45 0 объект
>
эндобдж
46 0 объект
>
эндобдж
47 0 объект
>
эндобдж
48 0 объект
>
эндобдж
49 0 объект
>
эндобдж
50 0 объект
>
эндобдж
51 0 объект
>
эндобдж
52 0 объект
>
эндобдж
53 0 объект
>
эндобдж
54 0 объект
>
эндобдж
55 0 объект
>
эндобдж
56 0 объект
>
эндобдж
57 0 объект
>
эндобдж
58 0 объект
>
эндобдж
59 0 объект
>
эндобдж
60 0 объект
>
эндобдж
61 0 объект
>
эндобдж
62 0 объект
>
эндобдж
63 0 объект
>
эндобдж
64 0 объект
>
эндобдж
65 0 объект
>
эндобдж
66 0 объект
>
эндобдж
67 0 объект
>
эндобдж
68 0 объект
>
эндобдж
69 0 объект
>
эндобдж
70 0 объект
>
эндобдж
71 0 объект
>
эндобдж
72 0 объект
>
эндобдж
73 0 объект
>
эндобдж
74 0 объект
>
эндобдж
75 0 объект
>
эндобдж
76 0 объект
>
эндобдж
77 0 объект
>
эндобдж
78 0 объект
>
эндобдж
79 0 объект
>
эндобдж
80 0 объект
>
эндобдж
81 0 объект
>
эндобдж
82 0 объект
>
эндобдж
83 0 объект
>
эндобдж
84 0 объект
>
эндобдж
85 0 объект
>
эндобдж
86 0 объект
>
эндобдж
87 0 объект
>
эндобдж
88 0 объект
>
эндобдж
89 0 объект
>
эндобдж
90 0 объект
>
эндобдж
91 0 объект
>
эндобдж
92 0 объект
>
эндобдж
93 0 объект
>
эндобдж
94 0 объект
>
эндобдж
95 0 объект
>
эндобдж
96 0 объект
>
эндобдж
97 0 объект
>
эндобдж
98 0 объект
>
эндобдж
99 0 объект
>
эндобдж
100 0 объект
>
эндобдж
101 0 объект
>
эндобдж
102 0 объект
>
эндобдж
103 0 объект
>
эндобдж
104 0 объект
>
эндобдж
105 0 объект
>
эндобдж
106 0 объект
>
эндобдж
107 0 объект
>
эндобдж
108 0 объект
>
эндобдж
109 0 объект
>
эндобдж
110 0 объект
>
эндобдж
111 0 объект
>
эндобдж
112 0 объект
>
эндобдж
113 0 объект
>
эндобдж
114 0 объект
>
эндобдж
115 0 объект
>
эндобдж
116 0 объект
>
эндобдж
117 0 объект
>
эндобдж
118 0 объект
>
эндобдж
119 0 объект
>
эндобдж
120 0 объект
>
эндобдж
121 0 объект
>
эндобдж
122 0 объект
>
эндобдж
123 0 объект
>
эндобдж
124 0 объект
>
эндобдж
125 0 объект
>
эндобдж
126 0 объект
>
эндобдж
127 0 объект
>
эндобдж
128 0 объект
>
эндобдж
129 0 объект
>
эндобдж
130 0 объект
>
эндобдж
131 0 объект
>
эндобдж
132 0 объект
>
эндобдж
133 0 объект
>
эндобдж
134 0 объект
>
эндобдж
135 0 объект
>
эндобдж
136 0 объект
>
эндобдж
137 0 объект
>
эндобдж
138 0 объект
>
эндобдж
139 0 объект
>
эндобдж
140 0 объект
>
эндобдж
141 0 объект
>
эндобдж
142 0 объект
>
эндобдж
143 0 объект
>
эндобдж
144 0 объект
>
эндобдж
145 0 объект
>
эндобдж
146 0 объект
>
эндобдж
147 0 объект
>
эндобдж
148 0 объект
>
эндобдж
149 0 объект
>
эндобдж
150 0 объект
>
эндобдж
151 0 объект
>
эндобдж
152 0 объект
>
эндобдж
153 0 объект
>
эндобдж
154 0 объект
>
эндобдж
155 0 объект
>
эндобдж
156 0 объект
>
эндобдж
157 0 объект
>
эндобдж
158 0 объект
>
эндобдж
159 0 объект
>
эндобдж
160 0 объект
>
эндобдж
161 0 объект
>
эндобдж
162 0 объект
>
эндобдж
163 0 объект
>
эндобдж
164 0 объект
>
эндобдж
165 0 объект
>
эндобдж
166 0 объект
>
эндобдж
167 0 объект
>
эндобдж
168 0 объект
>
эндобдж
169 0 объект
>
эндобдж
170 0 объект
>
эндобдж
171 0 объект
>
эндобдж
172 0 объект
>
эндобдж
173 0 объект
>
эндобдж
174 0 объект
>
эндобдж
175 0 объект
>
эндобдж
176 0 объект
>
эндобдж
177 0 объект
>
эндобдж
178 0 объект
>
эндобдж
179 0 объект
>
эндобдж
180 0 объект
>
эндобдж
181 0 объект
>
эндобдж
182 0 объект
>
эндобдж
183 0 объект
>
эндобдж
184 0 объект
>
эндобдж
185 0 объект
>
эндобдж
186 0 объект
>
эндобдж
187 0 объект
>
эндобдж
188 0 объект
>
эндобдж
189 0 объект
>
эндобдж
190 0 объект
>
эндобдж
191 0 объект
>
эндобдж
192 0 объект
>
эндобдж
193 0 объект
>
эндобдж
194 0 объект
>
эндобдж
195 0 объект
>
эндобдж
196 0 объект
>
эндобдж
197 0 объект
>
эндобдж
198 0 объект
>
эндобдж
199 0 объект
>
эндобдж
200 0 объект
>
эндобдж
201 0 объект
>
эндобдж
202 0 объект
>
эндобдж
203 0 объект
>
эндобдж
204 0 объект
>
эндобдж
205 0 объект
>
эндобдж
206 0 объект
>
эндобдж
207 0 объект
>
эндобдж
208 0 объект
>
эндобдж
209 0 объект
>
эндобдж
210 0 объект
>
эндобдж
211 0 объект
>
эндобдж
212 0 объект
>
эндобдж
213 0 объект
>
эндобдж
214 0 объект
>
эндобдж
215 0 объект
>
эндобдж
216 0 объект
>
эндобдж
217 0 объект
>
эндобдж
218 0 объект
>
эндобдж
219 0 объект
>
эндобдж
220 0 объект
>
эндобдж
221 0 объект
>
эндобдж
222 0 объект
>
эндобдж
223 0 объект
>
эндобдж
224 0 объект
>
эндобдж
225 0 объект
>
эндобдж
226 0 объект
>
эндобдж
227 0 объект
>
эндобдж
228 0 объект
>
эндобдж
229 0 объект
>
эндобдж
230 0 объект
>
эндобдж
231 0 объект
>
эндобдж
232 0 объект
>
эндобдж
233 0 объект
>
эндобдж
234 0 объект
>
эндобдж
235 0 объект
>
эндобдж
236 0 объект
>
эндобдж
237 0 объект
>
эндобдж
238 0 объект
>
эндобдж
239 0 объект
>
эндобдж
240 0 объект
>
эндобдж
241 0 объект
>
эндобдж
242 0 объект
>
эндобдж
243 0 объект
>
эндобдж
244 0 объект
>
эндобдж
245 0 объект
>
эндобдж
246 0 объект
>
эндобдж
247 0 объект
>
эндобдж
248 0 объект
>
эндобдж
249 0 объект
>
эндобдж
250 0 объект
>
эндобдж
251 0 объект
>
эндобдж
252 0 объект
>
эндобдж
253 0 объект
>
эндобдж
254 0 объект
>
эндобдж
255 0 объект
>
эндобдж
256 0 объект
>
эндобдж
257 0 объект
>
эндобдж
258 0 объект
>
эндобдж
259 0 объект
>
эндобдж
260 0 объект
>
эндобдж
261 0 объект
>
эндобдж
262 0 объект
>
эндобдж
263 0 объект
>
эндобдж
264 0 объект
>
эндобдж
265 0 объект
>
эндобдж
266 0 объект
>
эндобдж
267 0 объект
>
эндобдж
268 0 объект
>
транслировать
xVMoF] @ 7Pm / ̡h HJ (
lK «w ݥ ήD [ɢ6% {3oF ރ s {^

Произошла ошибка при настройке вашего пользовательского файла cookie

Произошла ошибка при настройке вашего пользовательского файла cookie

Этот сайт использует файлы cookie для повышения производительности.Если ваш браузер не принимает файлы cookie, вы не можете просматривать этот сайт.

Настройка вашего браузера для приема файлов cookie

Существует множество причин, по которым cookie не может быть установлен правильно. Ниже приведены наиболее частые причины:

  • В вашем браузере отключены файлы cookie. Вам необходимо сбросить настройки своего браузера, чтобы он принимал файлы cookie, или чтобы спросить вас, хотите ли вы принимать файлы cookie.
  • Ваш браузер спрашивает вас, хотите ли вы принимать файлы cookie, и вы отказались.Чтобы принять файлы cookie с этого сайта, нажмите кнопку «Назад» и примите файлы cookie.
  • Ваш браузер не поддерживает файлы cookie. Если вы подозреваете это, попробуйте другой браузер.
  • Дата на вашем компьютере в прошлом. Если часы вашего компьютера показывают дату до 1 января 1970 г.,
    браузер автоматически забудет файл cookie. Чтобы исправить это, установите правильное время и дату на своем компьютере.
  • Вы установили приложение, которое отслеживает или блокирует установку файлов cookie.Вы должны отключить приложение при входе в систему или проконсультироваться с системным администратором.

Почему этому сайту требуются файлы cookie?

Этот сайт использует файлы cookie для повышения производительности, запоминая, что вы вошли в систему, когда переходите со страницы на страницу. Чтобы предоставить доступ без файлов cookie
потребует, чтобы сайт создавал новый сеанс для каждой посещаемой страницы, что замедляет работу системы до неприемлемого уровня.

Что сохраняется в файле cookie?

Этот сайт не хранит ничего, кроме автоматически сгенерированного идентификатора сеанса в cookie; никакая другая информация не фиксируется.

Как правило, в файлах cookie может храниться только информация, которую вы предоставляете, или выбор, который вы делаете при посещении веб-сайта. Например, сайт
не может определить ваше имя электронной почты, пока вы не введете его. Разрешение веб-сайту создавать файлы cookie не дает этому или любому другому сайту доступа к
остальной части вашего компьютера, и только сайт, который создал файл cookie, может его прочитать.S + K ٫ + $ rMKN.e CIJs! LpgGu Մ sQJ9F {Fɻ *] 66)
конечный поток
эндобдж
38 0 объект
>
эндобдж
39 0 объект
[226 326 401 0 0 0 682 221 303 303498 498 250 306 252 386 507 507 507 507 507 507 507 507 507 507 268 268 0 0 0 46389457954 533 615 488 459 631 623 252319 520 420 855 646 662 517 673 543 459 487 642 567 890 519 487 468 0 0 0 0 498 0 479 525 423 525 498 305 471 525 230 239 455 230 799 525 527525 525 349 391 335 525 452 715 433 453 395 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 579 0 0 0 0 0 0 0 488 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 527 479 479 0 479 479 0 773 423 498 498 498 0 0 230 0 230 0 525 0 527 0 527 527 0 529 0 525 0 525]
эндобдж
40 0 объект
>
эндобдж
41 0 объект
[250 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 278 0 0 0 0 0 0 0 0 0 0 0 0 500 0500]
эндобдж
42 0 объект
>
транслировать
x | \ T; l ݅], + bKdY! h5 (LBb) ^ 41h & 7 $ 7 & ‘& sλ & _x; 3̼gf, $ (7M.NuPi $
9,
V9S5.NI2068 ߰ Q @ 0PS_ # NԎv) S: ʴF- ׇ f] O: ei $ Qt ֩ 6

ICEweb 2 — новый способ компиляции высококачественных веб-компонентов для корпуса ICE

Мартин Вайссер
Гуандунский университет иностранных языков

Абстрактные

В последние годы наблюдается возобновление интереса к составлению следующего поколения или новых субкорпусов ICE, возможно, также включающих новые жанры или данные. И поскольку сегодня компиляция корпуса через Интернет стала гораздо более удобным методом, чем традиционная выборка, используемая при создании оригинального корпуса ICE, имеет смысл попытаться скомпилировать как можно больше материалов для новых или обновленных письменных материалов ICE. из интернет-источников.Эта статья представляет ICEweb 2, новую и значительно усовершенствованную версию инструмента, предназначенного для сбора письменных данных для таких целей, а также для их обработки и анализа способами, аналогичными тем, которые предлагаются большинством пакетов согласования, таким образом, по крайней мере, в некоторой степени , избавляя от необходимости переключаться между инструментами.

За последние несколько лет возрос интерес к составлению корпусов ICE следующего поколения или новых субкорпусов, дополняющих исходные данные (см.Нельсон 2017). В частности, как указывает Нельсон, «корпуса ICE часто критикуют за то, что они слишком малы, всего по одному миллиону слов в каждом [так что] естественно, что исследователи должны призывать к все более крупным корпусам в ожидании того, что чем больше данных, тем лучше »(2017: 368). И хотя он продолжает указывать на то, что «уравнение не так просто» (2017), вероятно, нет сомнений в том, что наличие дополнительных данных равного качества может повысить репрезентативность и полезность корпусов ICE, а также повышение вероятности того, что новые, более редкие, местные явления могут быть обнаружены, или что, возможно, тенденции развития могут быть идентифицированы путем сравнения исходных данных с обновленными материалами.

Такие новые наборы данных могут также включать чисто сетевые жанры или данные из разновидностей Внешнего круга, то есть «Расширяющегося круга» (EC), поскольку, как совершенно справедливо утверждает Эдвардс (2017: 404), «[b] • Ограничиваясь странами Внутреннего и Внешнего Круга, ICE усиливает исключение английского языка EC как потенциального места динамичного использования и изменения английского языка ». Таким образом, чтобы избежать этой проблемы, становится очевидной необходимость расширить сферу применения корпусов английского как международного языка, чтобы мы могли лучше понять глобальное развитие языка и то, как это развитие, в свою очередь, может потенциально повлиять на Разновидности внутреннего и внешнего круга в своеобразном «эффекте обратного потока».

Следовательно, поскольку компиляция корпуса через Интернет теперь стала намного проще и, вероятно, также намного удобнее, чем использование традиционной выборки, используемой при создании исходных корпусов ICE, казалось бы, имеет смысл попытаться скомпилировать как можно больше материалов для этих новые или дополнительные материалы из интернет-источников. Однако при компиляции корпусов вне сети существует ряд очень важных моментов, которые необходимо учитывать при выборе правильного метода для правильной цели, что я попытаюсь проиллюстрировать в следующем разделе.

Поскольку цель этой статьи состоит не в том, чтобы представить новые и новаторские алгоритмы для автоматического сбора данных в Интернете, а в том, чтобы представить интегрированный инструмент, который позволяет лингвистам корпуса удобно собирать новые ICE или другие веб-данные и компилировать их в высококачественные качественные материалы, я не буду подробно останавливаться на многих технических деталях.

Сегодня создание веб-корпусов стало проще, чем когда-либо, с веб-интерфейсами, такими как Sketch Engine, даже позволяющими пользователям полуавтоматически компилировать свои собственные корпуса с использованием модифицированной версии BootCaT ( Bootstrapping Corpora and Terms from the Web ; Baroni & Бернардини 2004) подход.Тем не менее, такой более или менее автоматизированный подход имеет ряд преимуществ и недостатков; с одной стороны, теперь становится очень легко и удобно генерировать массив данных очень быстро, заполнив несколько полей и всего несколькими щелчками мыши, но, с другой стороны, наблюдается относительный недостаток контроля над полученными результатами. используя такие методы. Другими словами, пользователь / компилятор корпуса должен иметь высокую степень «слепой веры» в базовую технологию, в частности в способность программного обеспечения выявлять и удалять дубликаты, а также исключать так называемый шаблонный контент, т.е.е. контент, который предназначен в основном для навигационных или рекламных целей. Использование инструмента для таких типов веб-сканирования также может не позволить пользователю сказать, какой конкретный веб-движок запрашивается, чтобы создать список веб-страниц из их соответствующих URL-адресов ( Uniform Resource Locators, ), поэтому потенциально внесение предвзятости, вызванной политикой или технологией веб-движка. Более того, более или менее неконтролируемое сканирование почти наверняка вызовет проблемы с репрезентативностью.Основная причина этого заключается в том, что начальных терминов — т. Е. Поисковых терминов, которые помогают идентифицировать целевой домен — используемые для идентификации потенциально релевантных страниц, сами по себе ничего не могут сказать нам о том, действительно ли страницы, которые мы находим с их помощью, в конечном итоге отражают реальный жанр, который мы ». повторно пытаемся представить в нашем корпусе данные. Вместо этого они могут представлять только конкретную тему, которая может обсуждаться в самых разных жанрах. В конце концов, как отмечают Бибер и Курджян, «[с] большинством стандартных корпусов […] категории регистров легко идентифицируются и поэтому могут использоваться в лингвистических исследованиях.Однако в исследованиях, проводимых в Интернете, отсутствует эта важная справочная информация ». (Бибер и Курджян 2007: 111). Следовательно, чтобы определить, должна ли конкретная веб-страница быть включена в подкорпус для определенного жанра / категории, нужно, по крайней мере, бегло просмотреть эту страницу. Подробное обсуждение подобных проблем при сканировании Интернета в поисках данных см. В Schäfer and Bildhauer (2013) или Gatto (2014).

При условии, что выбраны правильные исходные термины, автоматизированный подход может быть очень полезным для создания больших специальных корпусов в специализированных и четко идентифицируемых областях.Это особенно актуально для извлечения предметной терминологии и фразеологии. Однако другой подход может быть более подходящим, когда мы пытаемся производить меньшие, более качественно ориентированные корпуса, и вопросы репрезентативности и жанра необходимо контролировать более точно. По сути, этот подход состоит из следующих, иногда циклических, этапов:

  1. определение сроков семян,
  2. запущенных веб-запросов,
  3. проверка и интерпретация адекватности результатов запроса «визуально»,
  4. , если необходимо, переопределив исходные термины и повторно запустив запрос,
  5. выбирая соответствующие результаты, а также,
  6. загрузка и редактирование данных корпуса.

Hundt et al. называют эту стратегию использованием «Сети для построения корпуса» (2007: 2), и, несмотря на определенные проблемы, описанные там (Hundt et al. 2007: 3) и в других публикациях (снова см. Schäfer & Bildhauer 2013, или Gatto 2014), этот метод представляет собой полезный способ создания высококачественных корпусных данных посредством визуального осмотра и, таким образом, может показаться более подходящим для создания корпусов меньшего масштаба, построенных в соответствии с принципами и категориями, первоначально использованными при составлении корпусов ICE. .

Исходная версия ICEweb, которая была создана в 2008 году, но выпущена не ранее 2013 года, сильно отличалась от версии 2, особенно потому, что она была более или менее предназначена для обслуживания набора категорий, лишь отдаленно связанных с существующими категориями ICE. Другими словами, хотя идея создания сопоставимых корпусов для разных стран, где английский был одним из основных используемых языков, определенно была частью схемы дизайна, многие из категорий, предусмотренных в дизайне, который мне предложил коллега, действовали. не пересекаются с существующими категориями ICE.Чтобы создать структуру корпуса, ICEweb1 предлагал два разных варианта: один, в котором более сложная предопределенная структура, содержащая различные подпапки, создавалась при настройке страны, и другой, где более простая структура для общих ссылок, содержащая только одну папку с именем genLinks был создан. Сложная структура состояла из набора папок основных категорий, каждая с набором папок подкатегорий, со всеми названиями категорий в нижнем регистре:

  • газет: репортажные, редакционные, письма-редакторы,
  • радио: новости, комментарии,
  • бизнес: информация, реклама,
  • туризм: информационный, убедительный,
  • университетов: информация, eap (для EAP, , английский для академических целей, ).

Кроме того, эта структура также содержала папку для общих ссылок. Хотя, конечно, теоретически было бы возможно создать «надлежащую структуру ICE» для страны, используя механизм настройки для создания «простой» структуры, это можно было бы сделать только со значительными усилиями, т. Е. Переименовав «genLinks». ‘и создание дополнительных подпапок, отражающих исходные категории ICE. И даже если инструмент был красиво красочным (см. Рис. 1), у него также было несколько других недостатков с точки зрения дизайна.

Рисунок 1. ICEweb версии 1.

Во-первых, добавление новых регионов или стран уже потребовало нескольких шагов и целевого выбора места назначения, заставляя пользователя проходить несколько диалогов. Что касается взаимодействия с веб-браузером, то также не было поддержки для заполнения или управления браузером изнутри инструмента. Для проведения любого поиска пользователю необходимо было отдельно открыть браузер, выбрать поисковую систему, перейти на соответствующую страницу и вручную сформулировать запрос с нуля.Все это нужно было сделать без какой-либо помощи в указании параметров языка и домена, чтобы ограничить этот поиск. Помимо этого, последние представляют собой шаги, которые многие пользователи, незнакомые с синтаксисом поиска соответствующих поисковых систем, не смогли бы выполнить без предварительного обучения.

Добавление или редактирование веб-адресов снова включало выбор целевой папки для запуска встроенного редактора веб-адресов ( URL; унифицированный указатель ресурсов ). Кроме того, после того, как были указаны все URL-адреса для загрузки и начался процесс загрузки, пользователь не мог контролировать последующие варианты и шаги обработки данных; все файлы были — с разрешения сервера — загружены, автоматически преобразованы в текст и токенизированы.

И последнее, но не менее важное: статистика, которую мог произвести инструмент, ограничивалась отчетом о количестве типов, токенов и соотношении типа / токена. Это, несмотря на то, что вся эта информация могла быть, по крайней мере, сообщена с функциональными словами или без них, тем не менее, на самом деле не было очень информативным или полезным, как можно было бы ожидать от инструмента, предоставляющего основную описательную статистику.

Следовательно, даже если инструмент позволял пользователям загружать веб-страницы для построения корпуса и, по крайней мере, избавлял их от необходимости создавать необработанные текстовые файлы для своего корпуса без какого-либо ручного вмешательства, общая полезность инструмента, особенно для работы с реальные категории ДВС, к сожалению, остались весьма ограниченными.

Поскольку я в основном работал с речевыми данными ICE с момента написания оригинальной версии ICEweb, в 2017 году, когда Джон Кирк и Джерри Нельсон провели опрос о том, как можно соответствующим образом обновить корпуса ICE, мой интерес к письменным данным ICE возродился. На тот момент я уже начал разрабатывать свои собственные планы по выполнению автоматического анализа речевых актов на письменных данных ICE и разработал идеи о том, как изменить и адаптировать исходный формат данных для облегчения этого.Этот конкретный формат аналогичен новому формату, который я рекомендовал для голосовых данных в Weisser 2017, и разработан для замены исходного, в настоящее время устаревшего, исходного SGML-совместимого формата, описанного в Nelson (1991, 1996). На этом этапе следующим логическим шагом была разработка лучшего способа сбора таких данных в Интернете путем использования большего количества общедоступных и частных текстов, доступных там, а также использования того факта, что часть исходной разметки HTML может быть очень полезен для идентификации структурных элементов, таких как заголовки, абзацы и т. д., что упростит создание данных в новом предполагаемом формате.

ICEweb 2 (далее просто ICEweb) теперь представляет собой инструмент, который упрощает для пользователя создание новых подкорпусов на основе критериев ICE, предоставляя удобный способ выбора местоположений и категорий ICE и автоматического создания соответствующих структур данных. Однако существующие категории также могут быть легко расширены на новые жанры с помощью тех же механизмов.

Кроме того, новая версия ICEweb также предоставляет помощь в построении и выполнении запросов через ряд различных поисковых систем для создания списков подходящих адресов веб-страниц для проверки пользователем.Следовательно, любой потенциальной предвзятости, вызванной использованием только одной поисковой машины (см. Раздел 1.1), можно в значительной степени избежать, составив списки, полученные на основе результатов этих различных машин.

страницы, идентифицированные таким образом, затем могут быть загружены полностью автоматически с сохранением исходного URL-адреса и другой метаинформации и очищены внутри инструмента перед преобразованием их в простой текст и / или специальную форму XML, предназначенную для более поздних прагматических аннотаций. Однако, в отличие от исходной версии, оба процесса преобразования не происходят автоматически, а инициируются пользователем, так что только тот формат, который действительно актуален для пользователя, должен быть сгенерирован по мере необходимости.Однако для большинства пользователей это, скорее всего, будет необработанный текстовый формат, с которым будут знакомы все лингвисты корпуса.

Помимо предоставления средств для загрузки, каталогизации и преобразования данных с целью создания определенного подкорпуса, ICEweb теперь также содержит средства для маркировки PoS, согласования и анализа n-грамм, включая регулируемое нормирование частоты, превращая его во все — круглый инструмент для работы с новыми данными ICE.

Наряду с этими новыми функциями и, по крайней мере, частично для их включения, дизайн интерфейса также изменился на форму с вкладками, аналогичную той, что была в AntConc (Anthony 2018).Такой дизайн позволяет пользователю лучше сосредоточиться на конкретных задачах, которые должны выполняться на различных этапах компиляции и анализа корпуса.

Таким образом, ICEweb теперь имеет следующие улучшения:

  • он включает предопределенные исходные категории ICE, но может быть легко расширен для обслуживания новых;
  • обеспечивает гораздо более интуитивный способ выбора регионов / стран и категорий;
  • наиболее подходящих папок создаются автоматически;
  • предлагает новые настраиваемые пользователем параметры для установки значений по умолчанию и т. Д.через файл конфигурации;
  • : новый интерфейс с вкладками четко разделяет отдельные задачи, выполняемые с помощью инструмента;
  • : все этапы обработки разделены, чтобы обеспечить больший контроль над данными;
  • предлагает улучшенные средства обработки и преобразования HTML, включая удаление шаблонов;
  • включает расширенные функции анализа (согласование & n-граммов), аналогичные тем, которые предоставляются другими специализированными инструментами корпуса.

В следующих разделах я более подробно опишу использование и преимущества ICEweb в качестве инструмента для построения и анализа корпуса и предоставлю подходящие иллюстрации.

Первый шаг в создании подкорпуса в ICEweb состоит в выборе региона — обычно континента — с последующим указанием страны и категории ICE из раскрывающихся списков, показанных в верхней части рисунка 2.

Рисунок 2.Параметры сбора URL-адресов ICEweb.

В нашем примере для параметра «Регион» установлено значение «Европа», для страны / местоположения — «Великобритания», а для категории ICE — «news_reportage». Подчеркивание между словами в названии категории предназначено для облегчения обработки на компьютере, поскольку пробелы могут представлять проблемы при обработке имен файлов или папок.

Выбор страны — пока незаметный для пользователя — также устанавливает ограничение для домена, в котором будет выполняться поиск, на основе его кода страны, когда поисковая система будет активирована позже.Все, что остается сделать, это выбрать «Местоположения → Изменить / добавить URL-адреса», и новый файл для сбора URL-адресов для загрузки будет создан и автоматически открыт в редакторе URL-адресов при подготовке к сбору данных. После того, как местоположение было выбрано таким образом и (остается) выбранным с помощью соответствующих раскрывающихся опций или задано в файле конфигурации, оно служит базовой конфигурацией корпуса для всех последующих действий, связанных с корпусом, таких как загрузки, шаги преобразования данных. , а также варианты анализа.

Второй шаг в сборе данных в ICEweb — убедиться, что выбрана вкладка «URL-адреса». Как следует из названия, эта вкладка по существу содержит все необходимые функции для управления веб-данными, которые должны быть загружены, а затем скомпилированы в соответствующий субкорпус.

Чтобы начать процесс поиска, пользователь может выбрать предпочтительную поисковую систему из другого раскрывающегося списка сразу под вкладкой «URL-адреса», выбирая между Google, DuckDuckGo и Bing.Как указывалось ранее, возможность выбора разных поисковых систем может помочь предотвратить предвзятость, вносимую одной поисковой системой, но, конечно, также дает возможность использовать альтернативные ресурсы в странах, где определенные машины могут быть заблокированы. Значение по умолчанию для этой опции также можно изменить / установить в файле конфигурации, чтобы пользователю не приходилось делать этот выбор повторно.

На следующем этапе пользователь должен ввести набор подходящих начальных терминов в соответствующее поле.Они должны максимально точно идентифицировать потенциальный целевой домен, поэтому в приведенном выше примере я выбрал термины новости и сегодня , потому что они, вероятно, будут давать ссылки на веб-страницы, содержащие самые свежие новости. Однако, как я пытался указать ранее, не все исходные термины автоматически позволяют сузить результаты до соответствующего жанра / категории, поэтому в большинстве случаев их следует рассматривать только как подходящую отправную точку для начала процесса идентификации. для подходящих страниц в первую очередь.

Нажатие кнопки «Выполнить запрос» затем запустит браузер пользователя по умолчанию, автоматически откроет страницу для выбранной поисковой системы, вставит исходные термины в поле поиска и, в зависимости от настроек (безопасности) поисковой системы, возможно, даже начать поиск автоматически. Однако, даже если поиск не начинается автоматически, пользователю достаточно нажать клавишу «Ввод», чтобы начать его, потому что обычно окно поиска активируется автоматически. Тем не менее, в дополнение к заполнению поисковой системы исходными терминами, ICEweb также использует информацию о стране, связанную с выбором пользователя, чтобы ограничить поисковый домен соответствующей страной, автоматически добавляя соответствующий параметр поиска в поле поиска после исходных терминов, вместе с официальным «кодом страны», представляющим местоположение.Таким же образом, язык идентифицируемых веб-страниц также установлен на English , как показано на Рисунках 3–5, которые отражают результаты соответствующих поисковых систем.

Рис. 3. Страница поиска Google®, заштрихованная.

Рис. 4. Страница поиска DuckDuckGo® с автоматическими результатами запроса.

Рис. 5. Страница поиска Bing® с автоматическими результатами запроса.

После отображения результатов поиска в Интернете появляется возможность проверять и идентифицировать релевантные страницы подходящей длины и содержания, в идеале открывая их на новых вкладках.Последнее обычно достигается путем нажатия на ссылку поисковой системы с помощью правой кнопки мыши и выбора соответствующей опции. Это упрощает возврат к исходной странице результатов поисковой системы, поскольку пользователю просто нужно закрыть новую вкладку, а не перезагружать любые предыдущие результаты.

Однако обратите внимание, что даже несмотря на то, что параметры поиска могли быть ограничены, не все страницы, которые идентифицирует машина, могут быть подходящими примерами в первую очередь из-за ошибок категоризации, сделанных поисковой машиной.Это, например, довольно легко увидеть в последнем примере на Рисунке 5. На самом деле здесь была найдена не новостная страница из Великобритании, а вместо страницы из Индии, которую, конечно же, следует исключить из процесса сбора. . Этот пример еще раз подчеркивает преимущество интерактивного процесса выбора над полностью автоматизированным сбором URL-адресов, поскольку слепое доверие классификации домена, предоставляемой поисковой системой, позволяет легко пропустить такую ​​ошибку, которая в худшем случае может повлиять на исследование. результаты, предполагая, что определенные черты из неправильной разновидности нашли свое отражение в другой.

Когда пользователь определяет подходящую страницу, URL-адрес может быть скопирован непосредственно из веб-браузера и вставлен в редактор URL-адресов, где каждый URL-адрес должен отображаться в одной строке. После того, как будет собрано достаточное количество URL-адресов, файл URL-адреса можно сохранить с помощью соответствующей кнопки.

Хотя основная функция результирующего файла URL-адреса заключается в том, чтобы позволить ICEweb загружать соответствующие страницы в процессе поиска, описанном ниже, он также предоставляет механизм комментирования, который можно использовать двумя разными способами.Самая простая форма состоит в том, чтобы позволить пользователю добавлять общие комментарии к файлу, добавляя к строкам префикс в виде решетки (или «символа фунта», если использовать американский термин). На рисунке 2 представлена ​​иллюстрация этого, где некоторые фрагменты мета-информации и информации об использовании были автоматически вставлены ICEweb при создании файла, но я также добавил дополнительный комментарий после того, как понял, что некоторые из новостных сайтов не разрешают загрузку своих страниц. автоматически, поскольку они были скрыты за так называемым «платным доступом», заставляющим пользователей платить за любой контент, который они хотели загрузить.Такие комментарии могут быть особенно полезны при создании документации для корпуса позже и, по крайней мере, частично для обоснования сделанного выбора. Кроме того, они могут предотвратить непреднамеренную попытку пользователя выполнить загрузку с таких сайтов с платным доступом позже, если корпус будет расширен, возможно, по прошествии значительного периода времени, и когда эта конкретная проблема с тех пор могла быть забыта.

Вторая функция механизма комментирования также вступает в игру всякий раз, когда может возникнуть необходимость добавить контент в корпус позже, либо если изначально собранные данные недостаточны для компенсации желаемого размера субкорпуса, либо если процесс сбора не может быть завершен за один раз и должен быть возобновлен позже.Здесь комментирование URL-адресов позволяет предотвратить повторную загрузку страниц — если явно не требуется, возможно, для получения последних версий — поскольку все строки, начинающиеся с символа комментария, исключаются из любой обработки.

Получить URL-адреса, собранные в URL-документе, довольно просто; все, что нужно сделать пользователю, — это активировать вкладку «Получение» и нажать кнопку «Получить веб-страницы». При условии, что правильные параметры для местоположения и типа категории по-прежнему выбраны, а список URL-адресов для загрузки был создан ранее, ICEweb теперь будет автоматически пытаться получить соответствующие веб-страницы.В процессе он также сообщит о базовой целевой папке для категории, URL-адресе, с которого в настоящее время выполняется загрузка, а также об успешной или неудачной загрузке для каждого из этих URL-адресов, как показано на рисунке 6.

Рисунок 6. Иллюстрация процесса поиска HTML.

В дополнение к загрузке и хранению максимально возможного количества веб-страниц — в виде необработанного HTML, без изображений, сценариев и т. Д. — в автоматически созданной подпапке с именем «html», ICEweb также создает или добавляет в файл CSV в папка основной категории.Для каждой успешно загруженной веб-страницы в этом файле с разделителями-табуляторами хранятся исходный заголовок и URL-адрес, локальное имя файла и время загрузки. Файл можно легко просмотреть в редакторе или приложении для работы с электронными таблицами, и он не только служит основой для создания документации для корпуса, но также позволяет позже вернуться на исходные веб-сайты для целей проверки, при условии, конечно, что они не были удалены или перемещены за это время.

Сохранение только необработанного HTML в некотором смысле также уже создает производную форму данных, так что вероятность нарушения каких-либо авторских прав уже в некоторой степени снижена только за счет потенциального изменения формата.Однако, поскольку статус авторских прав на веб-страницы, по крайней мере, для некоторых стран, остается неясным, пользователю все равно необходимо по своему усмотрению определять, можно ли распространить полученный корпус данных в подходящей форме. В случае сомнений лучше всего попытаться связаться с владельцами / создателями конкретных веб-страниц напрямую, что часто возможно, если веб-страницы содержат ссылку «mailto».

После успешной загрузки данных HTML в подпапку «html» их можно преобразовать в один из трех различных форматов.Для этого все, что необходимо, — это переключиться на вкладку «Данные» и нажать соответствующую кнопку «HTML → txt», «HTML → XML» или «Тег текста» (см. Рисунок 7).

Рисунок 7. Работа с данными.

Из этих трех форматов наиболее знакомым большинству пользователей корпуса является необработанный текст. В этом формате вся разметка, связанная с HTML, была просто удалена с исходной веб-страницы, и определенное количество «консервативных» шаблонных шаблонов, в основном основанное на кодировании для элементов навигации и, в некоторой степени, также на длине единиц HTML — имеет было выполнено, чтобы безопасно удалить как можно больше текстового материала, который может не иметь отношения к пользователю / корпусу.Этот шаблонный процесс удаления может не отражать «современные» методы, применяемые в компьютерной лингвистике, но выбранный здесь подход предназначен для предотвращения непреднамеренной потери пользователем любого полезного текста, и основное предположение состоит в том, что пользователь будет отредактируйте и дополнительно очистите полученный текст, как описано в следующем разделе, в любом случае перед включением его в корпус. Текстовые файлы, полученные в результате процесса преобразования, хранятся в другой подпапке с именем «текст».

Преобразование в XML создаст относительно простую форму XML, в которой процесс преобразования использует преимущества исходного кодирования HTML для определения различных типов единиц, таких как заголовки или абзацы, и соответствующего их кодирования. Этот формат все еще является экспериментальным и предназначен в первую очередь для последующего использования для анализа в Инструменте аннотации и анализа текста (TART; см. Weisser 2015), разработка которого, однако, к сожалению, была отложена и вряд ли будет завершена в ближайшее время. .В процессе автоматического преобразования в настоящее время не предпринимаются попытки идентифицировать единицы ниже абзаца, такие как предложения, из-за того, что любая сегментация на основе знаков препинания может быть несколько неточной (см. Михеев 2003), и особенно потому, что «предложения», которые могут потенциально идентифицируемые таким образом могут представлять более одной функциональной единицы с точки зрения реализаций речевых актов. Такая сегментация на подлинные функциональные блоки, конечно, может быть выполнена вручную, но поскольку ICEweb в настоящее время не предлагает вариантов для добавления предопределенных тегов XML к данным в редакторе, чтобы облегчить этот процесс, может быть лучше использовать другой инструмент, например мой Simple Corpus Tool , для такого рода редактирования.Однако возможность вручную аннотировать данные таким образом, вероятно, будет включена в более позднюю версию инструмента.

Несомненным преимуществом такого типа сегментации на функциональные единицы будет то, что более поздние анализы, такие как анализ n-грамм, не будут проводиться через границы единиц и, таким образом, станут более точными. Простым обходным решением для достижения этого, за исключением добавления XML, было бы, по крайней мере, разбить абзацы на такие функциональные блоки без их маркировки, просто добавив разрывы строк между ними, чтобы каждый блок отображался в отдельной строке, как все анализы в ICEweb (см. разделы 3.4.3 и 3.4.4) выполняются линейно.

Последний вариант формата — формат текста с тегами, где встроенный модуль тегирования может использоваться для добавления информации POS к необработанному тексту и храниться в подпапке «tagged». Эта опция, которая зависит от предшествующего преобразования в текст, то есть наличия данных в подпапке «текст», позже позволяет пользователю работать с морфо-синтаксически обогащенными данными в режимах анализа.

Здесь, однако, есть два предостережения: а) средство тегирования основано на относительно простом модуле вероятностного тегирования, Lingua :: EN :: Tagger (Coburn 2003), который обязательно приведет к более высокому уровню ошибок, чем е.грамм. TreeTagger (Schmid 1994) или Stanford POS Tagger (Toutanova et al. 2003), и б) что используемый набор тегов, как и в двух других упомянутых тегах, является PENN Treebank, который, имея всего 48 категорий POS, является довольно крупнозернистый и может не подойти для многих типов грамматического анализа, хотя этого должно быть достаточно для более ориентированных на синтаксис исследований, таких как синтаксический анализ. Если полученные данные предназначены для использования в исследованиях, требующих более высокой степени точности, я определенно рекомендую: а) вручную тщательно исправить выходные данные тегов и б) дополнительно пропустить их через мой Tagging Optimiser (Weisser 2018 ), который предназначен для исправления определенных ошибок, производимых вероятностными бесплатными тегами, а также улучшает набор тегов, увеличивая его почти вдвое до 94 тегов и повышая его читабельность, тем самым делая его более подходящим для грамматического анализа.Будущие версии ICEweb, вероятно, будут включать эту оптимизацию как встроенную опцию.

Файлы любой из четырех категорий («HTML», «текст», «XML», «помеченные») могут быть перечислены с помощью соответствующей кнопки папки, указанной на изображении папки над названием категории (снова см. Рисунок 7). Нажав соответствующую кнопку, можно просмотреть или отредактировать файлы во встроенном редакторе, а также открыть и просмотреть соответствующий файл HTML в браузере по умолчанию (см. Рис. 8) для сравнения.

Рисунок 8. Просмотр / редактирование текста и соответствующего HTML рядом.

Эта функция позволяет пользователю просматривать или редактировать файлы в различных форматах, в то же время имея возможность сравнивать извлеченный текст или файлы XML непосредственно с исходными файлами HTML, чтобы провести любое возможное постредактирование, которое может потребоваться. Поскольку ни один процесс преобразования никогда не бывает на 100% защищенным от несанкционированного доступа, а удаление шаблонного кода могло либо не удалить весь нерелевантный контент, либо, в более редких случаях, удалить что-то, что может быть полезным текстом, такое взаимодействие с данными в конечном итоге делает возможным чтобы создать более чистый и, следовательно, более полезный корпус.Поэтому я абсолютно рекомендую это как один из важных шагов в общем процессе компиляции корпуса, который всегда следует проводить до проведения любого анализа данных корпуса.

Помимо предоставления этих возможностей для компиляции корпусов на базе Интернета, ICEweb уже включает полезные функции, которые позволяют пользователю выполнять некоторые из наиболее распространенных типов лингвистического анализа корпуса, который в противном случае потребовал бы от пользователя использования внешних программ анализа, например AntConc (Энтони, 2018).Для всех этих типов анализа можно установить целевую папку по умолчанию на «текст», «xml» или «с тегами», в зависимости от потребности / цели анализа.

Даже если в настоящее время некоторые лингвисты корпуса могут утверждать, что «[в] сущности корпусная лингвистика — это количественная методология » (Брезина 2018: 3; мой курсив), согласование, очень качественная форма анализа, по-прежнему остается одной из наиболее распространенных и полезных форм исследования корпуса.Благодаря первоначальному взаимодействию с данными в процессе загрузки или редактирования или на основе функций, обсуждаемых в литературе по World Englishes, пользователи могут уже иметь определенные идеи об элементах, которые необходимо исследовать. Вот почему первый вариант анализа, который предоставляет ICEweb, — это создание согласований на основе собранных данных. Для этого сначала нужно переключиться на вкладку «Concordancer», которая также активирует опцию выбора целевой папки, а также «контекстно-зависимую» кнопку запуска, которая запускает любую форму анализа, оба из которых скрыты для всех. а вот режимы анализа.Эти параметры можно увидеть в верхней части рисунка 9.

Рис. 9. Иллюстрация модуля анализа Concordancer.

Одна вещь, которую следует отметить при работе со встроенным конкордансером, заключается в том, что, в отличие от большинства других конкордансеров, которые обрабатывают текст как непрерывный поток текста — т.е. основаны на потоке — и игнорируют все разрывы строк, конкордансер в ICEweb является построчным. . Другими словами, он находит условия поиска и первоначально отображает их в контексте любой строки текста, разделенной как минимум одним разрывом строки, в которой они находятся.На практике это может иметь небольшое значение для пользователя, за исключением того, что это несколько необычный формат, который отличается от более распространенного формата KWIC, и что контекст может быть либо длиннее, либо короче, чем можно было ожидать от отображения соответствия. . Причина этого различия заключается в том, что модуль согласования изначально был разработан для работы с текстовыми данными, где каждая функциональная единица текста — или то, что обычно воспринимается как «предложение» и обычно размечено как текстовая единица (см.Nelson 1996: 37) в исходной схеме разметки ICE — появляется в строке, где он отделен от аннотации XML, описывающей различные ее особенности. Подробнее об этом формате, который я называю «Простым XML», см. Weisser (2016: Глава 11).

Однако, помимо непосредственного контекста в любой строке, в которой найден любой из двух возможных условий поиска, существует также возможность настроить контекст окружающих строк, отображаемых вокруг первого условия поиска, на n -множество строк перед и / или после.Это позволяет лучше понять контекст дискурса или просмотреть любые окружающие аннотации / текст, а также просмотреть условия поиска и окружающие аннотации или наоборот, тем более что в равной степени можно определить относительное (линейное) положение второго термина. Эта функция, например, позволит пользователю искать заголовки, за которыми следует конкретный текст в следующем абзаце, при условии, что он работает с данными с аннотациями XML.

Как видно на рисунке 9, результаты согласования отображаются с попаданием, выделенным в поле с белым фоном и красным курсивом (желтый для второго условия поиска, не отображается в этом примере).Как и в случае с другими согласователями, обращение также имеет гиперссылку, позволяющую просматривать его в полном контексте файла, при этом гиперссылка показывает полный путь к файлу и номер строки, отображаемые под результатами. Однако отличие от большинства других конкордансеров заключается в том, что гиперссылки открывают встроенный редактор, так что пример можно не только просматривать, но и редактировать, например, для добавления дополнительных аннотаций.

Сам поиск основан на (полном Perl) регулярных выражениях (см. Введение в Weisser 2016: Глава 6), что делает его всегда чувствительным к регистру по умолчанию и позволяет определять относительно сложные (выглядящие) условия поиска.Это снова можно увидеть на рисунке 9. Точное значение некоторых функций регулярных выражений, показанных в примере, будет объяснено в следующем разделе.

Помимо самих результатов, также отображается количество совпадений и его «частота документов», то есть дисперсия.

Для модулей согласования и анализа результаты можно сохранить, выделив их в окне результатов с помощью Ctrl + a, скопировав с помощью Ctrl + c, а затем вставив в любой текстовый редактор или текстовый редактор, из которого они могут быть сохранены. .Это одна из причин, по которой информация, содержащаяся в гиперссылках, относительно подробна, поскольку в противном случае информация о файле, в котором было найдено попадание, и его позиции были бы потеряны. В будущих версиях могут быть снова предложены более удобные методы для хранения результатов, включая поисковый запрос, количество совпадений и дисперсию, которые не сохраняются при копировании и вставке из окна результатов, если их также не выбрать и скопировать вручную.

Второй вариант анализа, предлагаемый ICEweb, заключается в создании списков частотности слов или n-граммов из целевых файлов, где, в отличие от AntConc, первые просто обрабатываются как списки n-граммов, где n установлен на единицу, в другими словами, создание униграмм, вместо того, чтобы иметь отдельные вкладки для того, что по сути является одним и тем же типом списка переменной частоты.Создание таких списков может быть важно для исследования частотных распределений, например чрезмерное или недостаточное использование определенных элементов словарного запаса или для определения шаблонных выражений или (лексико) грамматических структур, которые могут быть уникальными для разнообразия.

Чтобы создать один из этих списков, сначала необходимо активировать вкладку «N-граммы», возможно, снова выбрать целевую папку и настроить требуемые параметры анализа. На рисунке 10 показан пример анализа необработанного текста с помощью триграммы.

Рисунок 10. Частота слов / анализ н-граммов.

Модуль анализа n-граммов сообщает количество идентифицированных слов / n-граммов и отображает их вместе с их необработанными («Freq.»), Нормированными («NFreq.») И частотой документов («DFreq.»). Нормированные частоты рассчитываются на основе свободно регулируемого нормирующего коэффициента с начальным значением по умолчанию 1000, чтобы избежать чрезмерной интерполяции (см. Weisser 2016: 175 для вопросов, связанных с несоответствующим нормированием частоты), поскольку проанализированные документы, вероятно, будут относительно небольшой.Еще одно отличие от AntConc в том, что n-граммы всегда имеют фиксированную длину, а не позволяют n охватить диапазон.

Как это принято для большинства инструментов, создающих такие списки, выходные данные можно сортировать различными способами, чтобы обеспечить различные представления данных для разных целей. Текущие параметры — это сортировка по убыванию частоты (‘n-1’), возрастанию частоты (‘1-n’), алфавитному (строго говоря ‘asciibetical’), где заглавные буквы появляются перед маленькими — порядок (‘a-z’ ), обратный алфавитный (‘z-a’), а также обратный отсортированный (‘rev’) частота, где слова / n-граммы сортируются в соответствии с их окончаниями.Последний вариант поддается морфологическому или тематическому анализу.

Перед генерацией n-граммов ввод очищается от всех возможных «знаков препинания», включая круглые скобки и двойные кавычки. Слова / н-граммы в результатах имеют гиперссылки для активации вкладки «Конкордансер» и инициализации первого поискового запроса, чтобы их можно было дополнительно исследовать путем согласования. Чтобы гарантировать, что все n-граммы могут быть найдены снова, любая ранее удаленная «пунктуация» автоматически повторно интерполируется в регулярное выражение в поле поиска.Это объясняет, почему шаблон для условия поиска соответствия, изображенный на рисунке 9, немного сложнее, чем простой поиск n-граммы, из которой он был взят. Как указывалось ранее, работа с данными, в которых текст разбит на функциональные единицы, делает анализ n-граммов более надежным, поскольку n-граммы, охватывающие несколько единиц, редко представляют интерес.

В дополнение к более общим параметрам настройки длины n-граммов и сортировки вывода ICEweb также содержит специальную функцию.[AZ] »в поле« Фильтр вывода »перед запуском анализа ограничит отображаемый результат — но не общее количество слов / н-грамм — только словами или н-граммами, которые начинаются с собственного имени или появляются предложения -изначально, как показано на рисунке 11. Эта функция, однако, может быть полезна не только для привязки n-граммов таким образом, но также для создания кластеров вокруг определенных поисковых терминов с целью исследования фразеологической изменчивости или паттернов.

Рисунок 11. (And | But | Or) \ b’ -, или вариант написания британских или американских вариантов написания через ‘[Cc] olou? r’, либо в модуле согласования, либо в модуле n-грамм и ведение учета количества появлений и разброса.

Для несколько более сложных задач, конечно, может потребоваться создать более полные списки таким образом, а затем аннотировать их в той или иной форме для обслуживания различных функций или даже импортировать списки n-граммов в приложение для работы с электронными таблицами, такое как Excel или статистический пакет, например R .

Однако здесь следует сделать очевидное предостережение. Несмотря на то, что такой инструмент, как ICEweb, может упростить сбор данных из Интернета, превратить их в корпус и выполнять даже, возможно, сложные типы анализа, достоверность любого такого анализа, конечно, в конечном итоге зависит от природы и репрезентативности данных. данные, собранные пользователем.Во многих случаях, особенно если количество собранных данных все еще относительно невелико, может быть целесообразно использовать такие результаты только как начальную отправную точку и сравнивать их (надеюсь) с эквивалентными данными из гораздо более крупного корпуса, такого как Корпус GloWbE (Дэвис, 2013). После того, как достоверность задачи будет установлена ​​или, по крайней мере, подтверждена таким образом, можно вернуться к сбору дополнительных данных.

Хотя ICEweb предназначен в первую очередь для работы с веб-данными, конечно, может оказаться невозможным найти подходящие данные — или их достаточное количество — в Интернете для всех категорий.В этом случае вполне возможно «импортировать» данные, собранные каким-либо другим способом, для создания единого корпуса. Все, что вам нужно сделать, это найти (или создать) соответствующую подпапку (и) в папке данных ICEweb и создать в ней папку «текст», в которую можно скопировать соответствующие данные. Любые версии XML — вместе с соответствующей папкой -, конечно, нужно будет создавать вручную. Это, вероятно, легче всего сделать с помощью упомянутого ранее инструмента Simple Corpus Tool , который позволяет пользователю создавать новые файлы XML на основе определенной пользователем структуры, вставлять в них содержимое текстовых файлов, а также определять свой собственный XML. теги и атрибуты и вставьте их в документы XML.

Любые необработанные текстовые данные, конечно, можно просто пометить и отредактировать с помощью встроенных средств ICEweb, чтобы создать версии с POS-тегами для анализа.

Как уже указывалось ранее, ICEweb также предлагает ряд полезных параметров конфигурации, управляемых через его легко редактируемый файл конфигурации. Они предназначены либо для облегчения повседневной работы с корпусом, либо для добавления новых параметров в инструмент. Что касается последнего, то можно легко добавить несколько новых вариантов региона или категории быстро, даже без использования обычного механизма для этого через меню или раскрывающиеся списки.Их можно просто добавить в файлы конфигурации, и, когда для них будет создан новый файл URL, соответствующие папки также будут созданы автоматически.

Другой тип параметров позволяет пользователю устанавливать различные типы параметров запуска по умолчанию, например, какую поисковую систему использовать по умолчанию, сколько строк предыдущего или последующего контекста должен отображать согласователь, какой нормирующий коэффициент использовать для n- граммов или какая вкладка инструмента должна быть активирована при запуске, в зависимости от того, на каком этапе процесса компиляции, редактирования или анализа корпуса был достигнут.

Все настраиваемые параметры также соответствующим образом прокомментированы относительно формата, который они принимают, так что очень сложно на самом деле сделать ошибку при их редактировании, за исключением фактического удаления их полностью, а сам файл конфигурации можно редактировать из инструмента.

В этой статье я представил и описал версию 2 ICEweb, инструмента, предназначенного для облегчения создания или добавления данных в корпуса ICE путем загрузки данных из Интернета, а также предоставления некоторых основных средств их анализа.Помимо описания функциональности и преимуществ инструмента, я также попытался указать на некоторые из его потенциальных применений и добавил несколько предостережений по мере необходимости, чтобы напомнить читателям, что создание чистых и пригодных для использования корпусов по-прежнему требует значительных затрат. усердия и ручных усилий для обеспечения качества и репрезентативности, даже если ICEweb должен значительно упростить процесс компиляции.

Расширяемый характер инструмента, конечно же, также делает его пригодным для других проектов по сбору корпусов через Интернет, начиная от классных приложений и заканчивая небольшими студенческими проектами, до составления потенциально гораздо более крупных корпусов для более продвинутых исследовательских целей.

Будущие версии ICEweb, вероятно, также будут содержать дальнейшие улучшения, такие как возможность использовать конфигурации прокси для работы в классе, чтобы гарантировать, что все учащиеся получают одинаковые результаты поиска, более широкие параметры сортировки, которые, мы надеемся, лучше интегрируют меры дисперсии и т. Д. Кроме того, поскольку инструментарий Perl / Tk, используемый для создания пользовательского интерфейса, временами бывает несколько «неуклюжим», особенно при выборе или отмене выбора текста, более поздние версии, которые, вероятно, будут написаны на Python и PyQt, надеюсь, устранят некоторые незначительные технические проблемы с удобством использования, которые все еще присутствуют.

Sketch Engine: https://auth.sketchengine.eu/

.

Энтони, Лоуренс. 2018. AntConc (Версия 3.5.7) [Компьютерное программное обеспечение]. Токио: Университет Васэда. https://www.laurenceanthony.net/software.html

Барони, Марко и Сильвия Бернардини. 2004. «BootCaT: самозагрузка корпусов и терминов из Интернета». Труды Четвертой Международной конференции по языковым ресурсам и оценке (LREC’04) , ed.Мария Тереза ​​Лино, Мария Франциска Ксавьер, Фатима Феррейра, Руте Коста, Ракель Сильва и др., 1313–1316. Париж: ELRA. http://www.lrec-conf.org/proceedings/lrec2004/pdf/509.pdf

Бибер, Дуглас и Джерри Курджиан. 2007. «К таксономии веб-регистров и типов текста: многомерный анализ». Corpus Linguistics and the Web , ed. Марианна Хундт, Надя Нессельхаф и Каролин Бивер, 109–131. Амстердам: Родопи.

Брезина, Вацлав.2018. Статистика в корпусной лингвистике: Практическое руководство . Кембридж: Издательство Кембриджского университета.

Коберн, Аарон. 2003. «Lingua :: EN :: Tagger». Программный модуль Perl . https://metacpan.org/pod/Lingua::EN::Tagger

Дэвис, Марк. 2013. Корпус глобального веб-английского языка: 1,9 миллиарда слов от носителей языка из 20 стран (GloWbE) . https://corpus.byu.edu/glowbe/

Эдвардс, Элисон.2017. «ICE age 3: Расширяющийся круг». World Englishes 36 (3): 404–426. DOI: 10.1111 / weng.12279

Гатто, Маристелла. 2014. Web as Corpus: Theory and Practice . Лондон: Блумсбери.

Хундт, Марианна, Надя Нессельхаф и Каролин Бивер. 2007. «Корпусная лингвистика и Интернет». Corpus Linguistics and the Web , ed. Марианна Хундт, Надя Нессельхаф и Каролин Бивер, 1–5.Амстердам: Родопи.

Михеев Андрей. 2003. «Сегментация текста». Оксфордский справочник компьютерной лингвистики , изд. Руслана Миткова, 209–221. Оксфорд: Издательство Оксфордского университета.

Нельсон, Джеральд. 1991. Руководство по письменным текстам . Лондон: Обзор использования английского языка.

Нельсон, Джеральд. 1996. «Системы разметки». Сравнение английского языка в мире: Международный корпус английского языка , изд.Сидни Гринбаум, 36–53. Оксфорд: Кларендон.

Нельсон, Джеральд. 2017. «Проект ICE и мировые английские языки». World Englishes , 36 (3): 367–370. DOI: 10.1111 / weng.12276

Schäfer, Roland & Felix Bildhauer. 2013. Создание веб-корпуса . Сан-Рафаэль, Калифорния: Издательство Morgan & Claypool.

Шмид, Гельмут. 1994. «Вероятностное тегирование части речи с использованием деревьев решений».Доклад представлен на Международной конференции по новым методам обработки языков, Манчестер, Великобритания.

Тутанова, Кристина, Дэн Кляйн, Кристофер Мэннинг и Йорам Сингер. 2003. «Многофункциональная маркировка части речи с циклической сетью зависимостей». Протоколы HLT-NAACL 2003 , 252–259. https://www.aclweb.org/anthology/N03-1033

Вайссер, Мартин. 2015. The Simple Corpus Tool (версия 1.5) [Компьютерное программное обеспечение].http://martinweisser.org/ling_soft.html#viewer

Вайссер, Мартин. 2016. Практическая лингвистика корпуса: введение в анализ языка на основе корпуса . Молден, Массачусетс и Оксфорд: Wiley-Blackwell.

Вайссер, Мартин. 2017. «Прагматическое аннотирование корпуса ICE — предварительные вопросы и шаги». Журнал ICAME 41: 181–214.

Вайссер, Мартин. 2018.«Автоматическое повышение точности и удобочитаемости тегов для распространенных бесплатных программных тегов». Труды Азиатско-Тихоокеанской конференции по корпусной лингвистике 2018 г. , 502–505. Такамацу, Япония.

Эмпирический перевод | PDF | Переводы

Вы читаете бесплатный превью

Стр. 10 не отображается в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 14 по 25 не показаны при предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 29 по 31 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 35 по 46 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 50 по 55 не показаны при предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 71 по 125 не показаны при предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 135 по 142 не показаны при предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 152 по 169 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 188 по 191 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 201 по 206 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 210 по 211 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 215 по 230 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 234 по 237 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 248 по 250 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 255 по 277 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 282 по 288 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 293 по 303 не показаны в этом предварительном просмотре.

Вы читаете бесплатный превью

Страницы с 318 по 322 не показаны в этом предварительном просмотре.

Формируя повествовательную арку: теоретико-информационный подход к совместному диалогу

Нам нужны средства, с помощью которых мы можем постепенно обновлять вселенскую веру по мере накопления свидетельств с каждым последующим высказыванием в диалоге.Мы начнем с определения понятия модели вселенной как средства моделирования динамики раскрытия информации. Рассмотрим конечный набор из вселенных , U. Роль модели вселенной заключается в оценке совместимости высказывания с данной дискретной вселенной, u∈U. Имея такую ​​модель, мы разрабатываем метод обновления апостериорного распределения вселенной агента по последовательности высказываний. Для каждой вселенной u модель вселенной присваивает вероятность p (xt | x1: t − 1, u) высказыванию xt, обусловленному диалогом x1: t − 1.

Модель вселенной итеративно обновляет апостериорное представление о вселенных в духе предсказаний экспертов-прогнозистов (Cesa-Bianchi & Lugosi, 2006)

. Вероятность данной вселенной зависит от итеративного комбинирования свидетельств в поддержку этой вселенной. Мы определяем апостериорную вероятность для вселенных

U, заданную последовательностью t высказываний x1: t, как:

пт (u | x1: t) = pt − 1 (u | x1: t − 1) × p (xt | x1: t − 1, u) p (xt | x1: t − 1)

Где pt − 1 (u | x1: t − 1)

— априорная вероятность,

p (xt | x1: t − 1, u) — вероятность произнесения, обусловленная прошлым диалогом и вселенной, а p ( xt | x1: t − 1) — вероятность произнесения речи в рамках модели разговора.

Пусть p0 (u | ⋅) = 1 / | U |, u∈U

будет изначально равномерным распределением по вселенным или априорной моделью вселенной. Мы можем маргинализировать вселенную, если доказательства согласуются со всеми гипотезами. Чтобы проиллюстрировать взаимосвязь между вероятностью высказывания и универсумом, мы можем явно записать предельную вероятность как:

p (xt | x1: t − 1) = ∑u′pt − 1 (u ′ | x1: t − 1) p (xt | x1: t − 1, u ′)

Таким образом, апостериор обновляется рекурсивно как:

пт (u | x1: t) = pt − 1 (u | x1: t − 1)
× p (xt | x1: t − 1, u) ∑u′pt − 1 (u ′ | x1: t − 1) p (xt | x1: t − 1, u ′) (1)

На практике может быть удобно использовать выход z (u | xt) вероятностного классификатора вместо функции правдоподобия, обусловленной прошлыми высказываниями x1: t и универсумом u

.Классификаторы юниверсов можно обучать отдельно от языковых моделей и обеспечивать дополнительный сигнал, если входные распределения модели перекрываются. Это предположение оправдано, если обе модели работают с одинаковыми словарями обучающего корпуса. Мы рассматриваем распределение вероятностей по вселенным, выводимое моделью вселенной, как полученное из совместного распределения

z (u, xt), вселенной u и высказывания xt. При z (u) в качестве априорного распределения по вселенным условная вероятность равна:

z (u | xt) = z (u, xt) z (xt) = z (u) × z (xt | u) z (xt)

Мы можем заменить z (⋅ | xt) на p (xt | x1: t − 1, ⋅) в уравнении.2.3, предполагая условную независимость (т. Е. P (xt | x1: t − 1, u) = p (xt | u)), равномерное априорное распределение (т. Е. Z (u) = 1 / | U |, u∈U) и постоянная предельная вероятность (т.е. z (xt) = ∑u′pt (u ′) p (xt | u ′)). Эти предположения оправданы, когда вероятностный тематический классификатор представляет собой наивный байесовский классификатор (Bishop, 2006) с единообразным априорным значением. Таким образом, замена выполняется следующим образом:

п (xt | x1: t − 1, u) ≈z (xt | u) [усл. независимость]
знак равно z (u | xt) z (xt) z (u)

[теорема Байеса]

≈z (u | xt) z (xt) [z (u) униформа приор]
≈z (u | xt) [z (xt) const.маргинальный]

Ур. 2.3 таким образом становится:

пт (u | x1: t) = пт − 1 (u | x1: t − 1)
× z (u | xt) ∑u′pt − 1 (u ′ | x1: t − 1) z (u ′ | xt) (2)

.