16
ответов

Есть ли все еще какая-либо причина изучить AWK?

Я постоянно изучаю новые инструменты, даже старомодные, потому что мне нравится использовать правильное решение для проблемы. Тем не менее, интересно, существует ли все еще какая-либо причина изучить некоторые из них. awk...
вопрос задан: 1 February 2012 13:23
11
ответов

Как я могу извлечь предопределенный диапазон строк из текстового файла в Unix?

У меня есть дамп SQL ~ 23000 строк, содержащий несколько баз данных данных. Мне нужно извлечь определенный раздел этого файла (то есть данные для одной базы данных) и поместить его в новый файл. Я знаю как ...
вопрос задан: 9 December 2016 16:34
10
ответов

Нахождение слов словаря

У меня есть много составных строк, которые являются комбинацией двух или трех английских слов. например, "SpiceJet" является комбинацией слов "специя" и "струя", я должен разделить этих отдельных англичан...
вопрос задан: 18 August 2009 04:21
7
ответов

Как использовать sed для замены только первого вхождения в файле?

Я хотел бы обновить большое количество исходных файлов C++ с дополнительным, включают директиву перед любым существующим #includes. Для этого вида задачи я обычно использую маленький сценарий удара с sed для переписывания...
вопрос задан: 19 November 2018 04:00
7
ответов

“Абсолютная” строковая метрика

У меня есть огромное (но конечный) набор строк естественного языка. Мне нужен способ преобразовать каждую строку в числовое значение. Для любой данной строки значение должно быть тем же каждым разом. Более "различное"...
вопрос задан: 23 May 2017 10:27
6
ответов

Как я могу удалить все строки, которые не начинаются с определенных символов?

Я должен выяснить регулярное выражение для удаления всех строк, которые не начинаются или "+" или "-". Я хочу распечатать бумажную копию большого различного файла, но это показывает приблизительно 5 строк прежде и после...
вопрос задан: 12 November 2009 20:47
5
ответов

Как заменить $ {} заполнители в текстовом файле?

Я хочу передать вывод по каналу "шаблонного" файла в MySQL, файл, имеющий переменные как $ {dbName} вкрапленный. Что является утилитой командной строки, чтобы заменить эти экземпляры и вывести вывод к...
вопрос задан: 3 November 2015 20:06
5
ответов

Как я определяю язык текстового документа в Java?

Есть ли существующая библиотека Java, которая могла сказать мне, содержит ли Строка английский текст языка или не (например, Я должен смочь отличить французский или итальянский текст - функция должна...
вопрос задан: 7 June 2012 16:26
5
ответов

Алгоритмы для обнаружения фраз и ключевых слов из текста

У меня есть приблизительно 100 мегабайтов текста, без любой разметки, разделенной приблизительно к 10 000 записей. Я хотел бы автоматически генерировать список 'тега'. Проблема состоит в том, что существуют словосочетания (т.е.
вопрос задан: 29 October 2009 16:40
4
ответа

Как преобразовать весь текст в нижний регистр в Vim

Как Вы преобразовываете весь текст в Vim к нижнему регистру? Это даже возможно?
вопрос задан: 12 March 2017 08:46
4
ответа

Обработка текста в bash - извлечение информации между несколькими тегами HTML и вывод ее в формат CSV [дубликат]

У меня есть несколько XML-файлов. Мне нужна информация между тегами, которую я могу легко получить с grep, но я не могу ничего с этим поделать. grep -oP '& lt; topic & gt; (. *) & lt; / teema & gt; | ...
вопрос задан: 24 December 2011 13:36
3
ответа

Удалите пустые строки в текстовом файле через grep

ФАЙЛ: привет мировая панель нечто, Как может, когда удаляют все пустые новые строки в этом ФАЙЛЕ? Вывод команды: ФАЙЛ: привет мировая панель нечто
вопрос задан: 4 August 2017 23:39
3
ответа

Чтение текста оценивает в matlab переменные от ASCII-файлов

Рассмотрите следующий файл var1 var2 variable3 1 2 3 11 22 33, я хотел бы загрузить числа в матрицу и заголовки столбцов в переменную, которая будет эквивалентна:...
вопрос задан: 28 August 2012 12:31
3
ответа

Пропустите строки файла, пока соответствие не будет найдено, затем произведет остальных

Я могу записать тривиальный сценарий, чтобы сделать это, но в моих продолжающихся поисках для получения более знакомым с Unix я хотел бы изучить использование эффективных способов, созданное в командах вместо этого. Я должен иметь дело с очень большим...
вопрос задан: 13 October 2008 09:55
2
ответа

То, как вычислить слово количества раз, появилось в файле или в некотором диапазоне

Иногда я хочу видеть, сколько раз определенная функция вызвана в файле или блоке кода. Как дела это? Я использую Vim 7.2. Я предполагаю, что необходимо использовать! туалет или некоторые такой.
вопрос задан: 20 April 2015 18:46
2
ответа

Строки Unicode в Ruby 1.9

Я записал сценарий Ruby, который читает файл (File.read ()), который содержит unicode символы, и он хорошо работает из командной строки. Однако, когда я пытаюсь поместить его в Рабочий процесс Automator (...
вопрос задан: 23 December 2009 23:00
2
ответа

Классификация текста на основе групп ключевых слов?

У меня есть список требований для проекта программного обеспечения, собранного от останков его предшественника. Каждое требование должно отобразиться на одну или несколько категорий. Каждая из категорий состоит из группы...
вопрос задан: 29 September 2009 00:54
1
ответ

Использование массивов в awk для сопоставления строк

Я пытаюсь использовать awk для сопоставления двух файлов (file1 и file2). Для каждой строки столбца в file2, которая соответствует file1, я бы хотел, чтобы команда выводила второй столбец в file1. Я посмотрел на ...
вопрос задан: 27 March 2019 14:36
1
ответ

Поиск слов в длинной строке на расстоянии редактирования без учета пробелов

Я ищу алгоритм для эффективного поиска слов в пределах заданного расстояния редактирования в строке запроса, игнорируя при этом пробел. Например, Если слова, по которым мне нужно построить индекс: OHIO, ...
вопрос задан: 21 February 2019 04:13
1
ответ

Лучший способ объединить вложение Word, чтобы получить вложение предложения

Я видел во многих ядрах и руководствах kaggle, считается, что встраивание среднего слова встраивает предложение. Но мне интересно, если это правильный подход. Так как он отбрасывает ...
вопрос задан: 20 January 2019 09:23
1
ответ

Разница в AWK при использовании NOR с печатью и без

Я новичок в AWK, и после игры со встроенной переменной NR я не понимаю следующий текст: CREDITS, EXPDATE, USER, GROUPS 99,01 июн 2018, sylvain, team ::: admin 52,01 дек 2018 , ...
вопрос задан: 19 January 2019 10:27
1
ответ

Используя SQL для определения статистики для подсчета количества слов текстового поля

Я недавно работал над некоторой функциональностью поиска базы данных и хотел получить некоторую информацию как средние слова на документ (например, текстовое поле в базе данных). Единственная вещь я нашел...
вопрос задан: 2 November 2011 21:29
1
ответ

Как разделить заголовки/нижние колонтитулы из Проекта тексты Gutenberg?

Я попробовал различные методы для разделения лицензии из Проекта тексты Gutenberg для использования в качестве корпуса для проекта изучения языка, но я, может казаться, не придумываю безнадзорный, надежный подход...
вопрос задан: 14 April 2011 14:54
0
ответов

Разработка классификатора для классификации документов на основе соответствия конкретных ключевых слов

Я работаю над постановкой задачи классификации документов. Для решения у меня уже есть список, содержащий некоторые конкретные ключевые слова из каждого класса, и мне нужно предсказать класс документа на его основе. ...
вопрос задан: 11 March 2019 15:01
0
ответов

Удалить компоненты первого каталога из пути к файлу

Мне нужно удалить один каталог (крайний левый) из переменных в Bash. Я нашел способы, как удалить весь путь или использовать имя каталога и другие, но он удалял весь или один компонент пути справа ...
вопрос задан: 19 July 2018 21:59
0
ответов

R-неструктурированные результаты API Rosette для структурирования с хорошей точностью

В настоящее время я работаю с данными набора данных офицера / ключевого контакта. Я отправляю URL-адрес API Rosette (обнаруживает сущности). Данные возвращаются к разным объектам с их позициями. ...
вопрос задан: 13 July 2018 09:26
0
ответов

Добавьте строку префиксов к началу каждой строки

У меня есть файл как указано ниже: line1 line2 line3 И я хотим добраться: prefixline1 prefixline2 prefixline3, который я мог записать сценарию Ruby, но лучше, если я не должен. префикс будет содержать/. Это...
вопрос задан: 28 June 2018 04:33
0
ответов

Какой алгоритм хеширования следует использовать для сравнения фрагментов текста?

У меня есть большое количество фрагментов текста, которые мне нужно сравнить между собой, чтобы проверить, похожи они или нет. Каждый кусок составляет около 10000 слов. Следовательно, я предварительно вычислю хеш ...
вопрос задан: 14 August 2017 10:27
0
ответов

Как добавить новую строку текста в существующий файл на Java? [дубликат]

Я хочу добавить новую строку в существующий файл, не стирая текущую информацию об этом файле. Вкратце, вот методология, которую я использую в настоящее время: import java.io ....
вопрос задан: 5 December 2014 18:35
0
ответов

Как uʍop-ǝpᴉsdn текст работает?

Вот веб-сайт, я нашел, что это произведет перевернутые версии любого английского текста.как это работает? unicode имеет перевернутые символы? Или что? Как я могу записать свой собственный текст, зеркально отражающий функцию?
вопрос задан: 20 October 2012 18:21