Hy ,
У меня следующая проблема. У меня есть 2 набора данных, один из которых содержит данные следующей структуры:
A1 B2 C1 D1
A1 B2 C1 D3
A3 B1 C2 D2
etc
А другой содержит значения для этих объектов:
A1=x
B2=y
C1=z
D1=q
etc
Как я могу сгруппировать данные так, чтобы я мог иметь A1 = x B2 = y C1 = z D1 = q в одном месте, чтобы вычислить их?
Спасибо!
1 ответ
Если второй набор данных невелик, вы можете поместить его в распределенный кэш.
Вы можете построчно прочитать 1-й набор данных в преобразователе, а затем использовать ввод из распределенного кеша для получения значений, а затем выдать пару «ключ-значение», например: <"A1 = x B2 = y C1 = z D1 = q" , 1>
Похожие вопросы
Новые вопросы
hadoop
Hadoop - это проект с открытым исходным кодом Apache, который предоставляет программное обеспечение для надежных и масштабируемых распределенных вычислений. Ядро состоит из распределенной файловой системы (HDFS) и менеджера ресурсов (YARN). Различные другие проекты с открытым исходным кодом, такие как Apache Hive, используют Apache Hadoop в качестве слоя персистентности.
DistributedCache
и читать его с помощью картографов.