hadoop - лучшие вопросы о Unix / linux операционная система (юникс)

Программа сжатия данных. Первоначально утилита GNU это было клонировано большинством вариантов Unix.

Еще нет никакого тега Wiki для этого тега …!

Справка wikis тега представляет вновь прибывших тегу. Они содержат обзор темы, определенной тегом, наряду с инструкциями по его использованию.

Все зарегистрированные пользователи могут предложить новый тег wikis.

(Обратите внимание, что, если у Вас есть меньше чем 20 000 репутаций, Ваш тег, Wiki будет одноранговым узлом, рассмотренным, прежде чем это будет опубликовано.)

---------121--------967----Hadoop предоставляет Высоконадежные услуги путем распределения обработки больших наборов данных через кластеры машин.

Hadoop предоставляет Высоконадежные услуги путем распределения обработки больших наборов данных через кластеры машин.

Hadoop от Apache, включает модули:

Распространенный Hadoop: утилиты поддержки
Распределенная файловая система Hadoop (HDFS)
Hadoop YARN: планирование задания и управление ресурсами
MapReduce Hadoop: параллельная обработка больших наборов данных

Это используется такими тяжеловесами как Facebook и Твиттер.

Проекты Apache на основе Hadoop должны, вероятно, использовать свой собственный тег, а именно, Кенаф, Avro, Cassandra, Chukwa, HBase, Hive, Mahout, Свинья, Spark, Tez и ZooKeeper.

ответа

mount.nfs: сбой системного вызова mount

Я пытаюсь смонтировать hdfs на моем локальном компьютере под управлением Ubuntu с помощью следующей команды: --- sudo mount -t nfs -o vers = 3, proto = tcp, nolock 192.168.170.52:/ / mnt / hdfs_mount / Но я получаю это ...

28.06.2017

ответ

Mac OS ssh :Сброс соединения узлом

Для работы с Hadoop я отредактировал файл hosts и удалил несколько строк (эти строки мешали корректной работе ). При запуске ssh localhost я столкнулся с ошибкой :kex _обмен _идентификация :чтение :сброс соединения пиром hosts.allow :сшд

hadoop macos ssh

22.11.2021

ответ

Я не знаю, почему SSH и Hadoop подключаются не к тому месту

У меня есть 3 виртуальные машины :master@master -virtualbox worker1@worker1 -виртуальный бокс worker2@worker2 -virtualbox Когда я пытаюсь скопировать ssh id с worker1 на master, запрашивается пароль, который я не знаю какой...

hadoop ssh

02.03.2021

ответ

Невозможно обновить python на hdfs cloudera

Не удалось обновить Python в Cloudera, так как он показывает ошибку всякий раз, когда я запускаю приведенную ниже команду :$ sudo yum установить python27 ошибка :Нет доступного пакета python27. $ sudo yum установить python36u ошибка :Нет...

hadoop software-installation

05.10.2020

ответ

Кластер Hadoop + проектирование количества дисков на машине узла данных и минимальных требований

мы используем версию HDP — 2.6.5, а репликация блока HDFS — 3, мы пытаемся понять минимальные требования к дискам узлов данных для производственного режима и в соответствии с тем, что блочная репликация = 3 ...

hdfs hadoop linux

19.01.2020

ответ

Какой правильный mkfs cli для создания файловой системы xfs на огромном диске

Нам нужно создать файловую систему xfs на диске kafka Особенностью диска kafka является диск размер диска kafka имеет размер 20 ТБ в нашем случае. Я не уверен насчет следующих mkfs, но мне нужен совет, чтобы ...

disk hadoop kafka mkfs xfs

16.12.2019

ответ

bash :pig :команда не найдена

Я пытаюсь выяснить, какую версию свиньи я использую. Я думал, что уже установил его #yum install hadoop\ *mahout\ *oozie\ *hbase\ *hive\ *hue\ *pig\ *zookeeper\ *Когда я пытаюсь ввести свинью...

hadoop

10.04.2019

ответ

как запустить CLI из root с пользователем hdfs

когда я запускаю следующий cli от пользователя hdfs, он работает хорошо # su hdfs $ hadoop fs -du -s / home / test / * | awk '{sum + = $ 1} END {print sum}' 4182692 но когда я запускаю его от root, ...

linux shell-script hadoop

05.03.2019

ответ

Почему когда-то нужно прекратить процесс убить -9

у нас есть машины KAFKA в кластере Hadoop сценарий, который остановит процесс KAFKA, выполняет следующее kill PID, но мы замечаем, что скрипт, который остановит кафка Не Союзни убить процесс, поэтому мы ...

linux process kill ps hadoop

07.01.2019

ответ

Как лучше управлять очисткой / TMP на машинах Hadoop

как все знают, что содержимое / TMP следует удалить через некоторое время. В моем случае у нас есть машины (Redhat версия 7.2), которые настраиваются в следующем. Как мы можем видеть, как срабатывает на службе ...

linux rhel cron services hadoop

19.12.2018

ответ

Hadoop: Найдите имя хоста или IP-адреса на основе идентификатора процесса

. Можно ли найти IP-адрес или имя хоста, который представил работу на основе PlexiD? У нас есть несколько рабочих мест Hadoop для сотен часов. Нам нужно знать, с какого локальной машины это ...

process hadoop

20.08.2018

ответ

Можем ли мы смешивать значения MTU в кластере

у нас есть хаду-пастер (все машины - это машины linux redhat версии 7.x) на машинах ВМ, которые мы установили MTU=8900, а все остальные машины, которые мы установили MTU=9000, мы установили на VM MTU=8900, потому что мы видели некоторые ...

linux networking network-interface hadoop

25.06.2018

ответ

как найти правильное значение MTU Jumbo frame [закрыто]

Мы приняли решение установить jumbo-кадры на всех наших Linux-машинах. У нас есть кластер hadoop с главными машинами, рабочими машинами и машинами Kafka. Наши коммутаторы (Cisco) подходят для Jumbo ...

hadoop linux networking network-interface rhel

06.03.2018

ответ

install hadoop_2_6_1_0_129-hdfs

попытался установить сервер временной шкалы приложений кластера Hadoop. Установка вернула ошибку: 2018-02-26 19: 31: 49,406 - Установка пакета hadoop_2_6_1_0_129- hdfs ('/ usr / bin / yum -d 0 -e 0 -y install ...

rhel software-installation yum dependencies hadoop

04.03.2018

ответ

Ambari и Spark не запускаются из интерфейса командной строки

Из графического интерфейса Ambari мы не можем запустить службу Spark. Итак, мы хотим запустить его из командной строки следующим образом: [spark @ mas01 spark2] $ ./sbin/start-thriftserver.sh --master yarn-client --executor -...

hadoop

02.03.2018

ответ

systemd - определить службу без ExecStop и иметь возможность остановить ее без сбоев

Я использую CentOS 7, и я хочу запустить автономный производитель Kafka (File Connector) в качестве службы. Команда: /opt/kafka/bin/connect-standalone.sh /opt/kafka/config/connect-standalone.properties /...

systemd services hadoop

02.03.2018

ответ

Кластер Hadoop с Ambari - лучший способ изменить конфигурации

У нас есть кластер Hadoop, клиенты устанавливаются на машины Linux Red Hat и централизованное управление через Apache Ambari . список вкусняшек | grep ambari-server ambari-server.x86_64 2.5.0.3-7 ...

api hadoop json

02.03.2018

ответ

RPC: Ошибка сопоставителя портов - Невозможно получить: errno 113 (Нет маршрута к хосту)

Я пытаюсь смонтировать hdfs на моем локальном компьютере (ubuntu) с помощью nfs, перейдя по следующей ссылке: - https: / /www.cloudera.com/documentation/enterprise/5-2-x/topics/cdh_ig_nfsv3_gateway_configure.html # ...

apt hadoop mount nfs ubuntu

28.06.2017

ответ

copyFromLocal Hadoop No such file or directory error

У меня есть следующий код из командного терминала Fedora : [root@localhost python_code]# pwd /root/python_code [root@localhost python_code]# cd ... [root@localhost ~]# ls anaconda-ks.cfg ...

fedora hadoop

30.04.2016

ответ

Unexpected EOF while looking for matching ' " '

Я пытаюсь настроить hadoop с помощью cygwin. Я впервые использую unix-окружение, но при настройке hadoop-env.sh я получаю эту ошибку EOF # Licensed to the Apache Software Foundation (...

bash hadoop shell-script

26.03.2016

ответ

сбой привязки, адрес используется: Unable to use a TCP port for both source and destination?

Я отлаживаю Hadoop DataNodes, которые не запускаются. Мы используем saltstack, а также elasticsearch на машинах. Ошибка Hadoop DataNode довольно ясна: java.net.BindException: Problem binding ...

hadoop

14.12.2015

ответов

Скопируйте файлы из папки hdfs в другое место hdfs, отфильтровав по дате изменения с помощью сценария оболочки.

У меня есть данные за 1 год в моем местоположении hdfs, и я хочу скопировать данные за последние 6 месяцев в другое место hdfs. Можно ли скопировать данные только за 6 месяцев непосредственно из команды hdfs или нам нужно...

hadoop linux shell shell-script

19.07.2019

ответов

Невозможно выйти из интерактивного режима для команды yarn top

У меня есть сценарий bash, который находится на serverA. Этот сценарий отправляет ssh на serverB и запускает команду yarn top, извлекает метрики и помещает их в файл (test.txt) на serverA. Ниже представлена команда, которую я использую: ...

bash hadoop linux scripting top

14.08.2018

ответов

Сделать виртуальный бокс другим IP-адрес, отличный от моего ноутбука

Я пытаюсь настроить 2-узловой кластер Hadoop (следуя этому руководству), где главным будет мой ноутбук с Ubuntu, а подчиненным - виртуальный бокс, работающий под управлением Ubuntu. Я также читал о сети i n ...

cluster hadoop ip networking virtualbox

13.04.2017

ответов

Как переместить каталог?

У меня есть каталог в HDFS с подкаталогами, которые содержат файлы part-xxxxx, созданные Spark. Я хочу переместить этот каталог (и все, что в нем) в новый каталог. Инструкции? Моя попытка: [...

distributed-filesystem directory filesystems hadoop mv

15.09.2016

ответов

mv: target 'hadoop/' is not a directory

Я использую Fedora 23, которая установлена на Oracle VM. Я нахожусь на этапе загрузки Hadoop в документации здесь. Когда я выполняю следующую команду в Fedora, я вижу пользователя hadoop в списке: [...

fedora hadoop

06.04.2016

ответов

sqoop2 не запускается

Мой sqoop2 внезапно умирает и не может запуститься 2 дня назад, я не менял никаких настроек на sqoop2, я проверил журнал каталины / var / log / sqoop2, в нем говорится: 14 марта 2016 г. 14:06:17 org.apache.catalina ....

hadoop linux

14.03.2016

ответов

Подключить символическую ссылку к программе или сценарию, который возвращает файл

Я хотел знать, могу ли я сделать символическую ссылку на файл, скажем, в базе данных. Это дикая догадка, но можно ли перехватить ссылку, скажем, с помощью функции C, а затем позволить функции вернуть ...

cygwin hadoop symlink

27.12.2015

ответов

Оптимальная конфигурация мощности ЦП в BIOS для высокопроизводительного Hadoop?

Я нахожусь в процессе настройки кластера Hadoop и пока что {{ 1}} не удалось найти хороший ответ о том, как настроить мощность процессора в BIOS для Linux. В моем BIOS есть множество опций с ...

linux cpu bios hadoop

05.09.2015