Тег «дубликаты» относится к обнаружению и / или работе с несколькими экземплярами элементов в коллекциях.

Подробнее про duplicates...

У меня есть несколько наборов данных, которые я объединил с помощью rbind. Наборы данных содержали исходные идентификаторы, и я прикрепил уникальный номер для каждого набора данных (например, все данные из набора данных 1 имеют dfid = 1, а каждая строка из набора данных 1 имеет исходный идентификат....
11 Окт 2021 в 12:53
Если это мой набор данных Id Weight Category 1 10.2 Pre 1 12.1 Post 2 11.3 Post 3 12.9 Pre 4 10.3 Post 4 12.3 Pre 5 11.8 Pre Как мне избавиться от повторяющихся идентификаторов, которые также являются Category = Pre. Мой последний ожидаемый набо....
10 Окт 2021 в 10:27
У меня есть следующий набор данных idA idB value 1 5 0.11 2 6 0.25 3 7 0.3 4 8 0.4 . . . . . . . . . . . . . . . 5 1 0.11 6 2 0.25 7 3 0.3 8 4 0.4 IdA и idB - это идентификаторы для одного и того же набора данных (в основном idA и idB происходят и....
9 Окт 2021 в 00:30
У меня есть фрейм данных с 3 столбцами классов и 5 строками студентов в каждом классе. Некоторые из этих студентов - дубликаты. Я хочу перечислить наиболее распространенные имена студентов из всех классов и перечислить их в порядке убывания, количество раз, когда они существуют, и классы, в которы....
6 Окт 2021 в 21:01
Я пытаюсь очистить набор данных, удалив ненужные строки. вот образец моих наборов данных: первое изображение показывает набор данных, а второе изображение показывает, чего я пытаюсь достичь. поэтому я пытаюсь удалить все строки с похожим идентификатором, но оставлю только одну вверху. введите опис....
6 Окт 2021 в 16:15
У меня есть набор данных с более чем 15000 строками, который выглядит примерно так: ID valid_from valid_until action action_text 1 1 01/01/2010 31/01/2016 1 Text1 2 1 01/02/2016 01/01/2021 2 Text2 3 2 01/10/2010 30/09/2019 4 Text4 4 3 01/05/2015 31/12....
5 Окт 2021 в 19:08
Фон У меня есть этот фрейм данных R, d: d <- data.frame(ID = c("a","a","a","a","a","a","b","b"), event = c("G12","G12","G12","B4","B4","A24","L5","L5"), stringsAsFactors=FALSE) Выглядит это так: Как видите, в нем есть 2 разных ID, каждый из которых имеет events, н....
1 Окт 2021 в 08:38
Мне нужно сделать следующие шаги в двух столбцах -A и B- моего df и вывести результат в C: 1) check if value from B is present in A -on row, at any position 2) if present but in another format then remove 3) add value from B in A and output in C A B C tsh....
28 Сен 2021 в 00:53
Я пытаюсь удалить дубликаты в строках, но мне нужны строки с длиной <= 2 и целым числом. У меня есть такое предложение: AIR OPTIX Air Optix plus HydraGlyde Lenti a Contatto Mensili, 6 Lenti, BC a 6 mm, DIA 14.2 mm, -0.75 Diopt Мне нужно получить: AIR OPTIX plus HydraGlyde Lenti a Contatto Mensili, ....
27 Сен 2021 в 23:12
У меня есть два флажка, которые называются слабыми и командами. Если я проверю слабину, я хочу, чтобы изображение слабины отображалось на другом компоненте. Я почти сделал это, но он показывает и слабину, и команды. Пожалуйста, взгляните на мое изображение, вы можете понять, о чем я пытаюсь спрос....
27 Сен 2021 в 09:54
У меня есть список таких наречий list = [ { "a": "1", "b": "2", "c": "3" }, { "a": "4", "b": "2", "c": "6" }, { "a": "7", "b": "8", "c": "9" }, { "a": "10", "b": "11", "c": "12....
24 Сен 2021 в 18:02
Я хочу написать программу, которая проверяет повторяющиеся значения и удаляет их. Так, например, я хочу от этого: list = [2,6,8,2,9,8,8,5,2,2] Чтобы получить только это: uniques = [6,9,5] Кажется, я не могу найти хороший способ сравнить каждый элемент друг с другом, чтобы увидеть, равны ли они, и у....
23 Сен 2021 в 15:44
Я не могу найти ответ в Интернете. Предположим, у меня есть df1, который выглядит так со следующими именами столбцов, и я не могу просто использовать отбрасывание для всех повторяющихся имен столбцов, как предлагают большинство онлайн-ответов. index year season 1 2 3 year seas....
20 Сен 2021 в 22:21
В R я хочу объединить строки, в которых точки данных с одинаковыми координатами x, y можно объединить с помощью формулы, чтобы получить одну строку, представляющую объединенные значения области. (Многоствольные деревья, но одно и то же растение с репрезентативным комбинированным диаметром или площа....
19 Сен 2021 в 14:01
У меня есть этот образец фрейма данных: df <- data.frame(ID = c("5","5","5","5","5","5" ,"5" ,"5","5","5","5","14","14","14","14" ,"14","14"), Date1= c("22/07/2014","22/07/2014","22/07/2014" ,"22/07/2014" ,"22/07/2014" ....
19 Сен 2021 в 00:15
Рассмотрим этот фрейм данных. df = pd.DataFrame(data={'one': list('abcd'), 'two': list('efgh'), 'three': list('ajha')}) one two three 0 a e a 1 b f j 2 c g h 3 d h a Как я могу вывести все повторяющиеся значения и их ....
17 Сен 2021 в 23:56
У меня есть массив, который выглядит так: Есть ли способ, которым, когда в массив добавляется другой объект «AAPL», добавляются сборы и сумма, а AAPL остается одним объектом в массиве? Заранее спасибо!....
17 Сен 2021 в 14:54
Я работаю с языком программирования R. Предположим, у меня есть следующие данные: Data_I_Have <- data.frame( "Person" = c("John", "John", "John", "Peter", "Peter", "Peter", "Tim", "Kevin", "Adam", "Adam", "Xavier"), "Number_of_Kids" = c("4", "1", "1", "5", "2", "3", "7", "....
15 Сен 2021 в 22:26
Я пытаюсь использовать хэш-карты для обнаружения любых дубликатов в данном списке, и если они есть, я хочу добавить «1» к этой строке, чтобы указать на ее дублирование. Если это произойдет 3 раза, третий добавит "3" после этой строки. Я не могу этого понять, отслеживая количество дубликатов. Он до....
4 Сен 2021 в 15:53
У меня есть код, который выглядит так Month| Day| Year| Color| Weather|Location|Transporation|ID Jan Tue 2020 Blue Warm Hospital NA 1 Jan Tue 2020 Blue Warm NA NA 1 Jan Tue 2020 Blue NA NA NA 1 ....
3 Сен 2021 в 21:01
У меня есть данные с несколькими столбцами, как показано ниже. Я хочу удалить строки с повторяющимися значениями в столбце глубины. Date Levels values depth 1 2005-12-31 1 182.80 0 2 2005-12-31 2 182.80 0 3 2005-12-31 5 182.80 2 4 2005-12-31 6 182.8....
1 Сен 2021 в 16:49
Я пытаюсь найти всех лауреатов Нобелевской премии, которые выиграли более одного раза с 1901 по 2016 год. Я попробовал метод pandas duplicate(), но он вернул все дубликаты один раз, кроме одной строки или элемента. Я получаю дубликаты на основе столбца full_name в DataFrame. Я пробовал разные комб....
24 Авг 2021 в 23:01
Я новичок в программировании и изучении Javascript, выполняя некоторые упражнения из leetcode.com. Я хотел написать код для удаления дубликатов в отсортированном массиве. Когда я использую console.log в конце функции, чтобы показать окончательный результат, я получаю ожидаемый результат. Однако, ....
23 Авг 2021 в 11:48
После фильтрации обратных дубликатов я должен подсчитать, сколько существует фактических дубликатов. Вот мой (рабочий пример) код, но он слишком медленный, для 90 000+ строк .. с использованием iterrows: import pandas as pd data = {'id_x':[1,2,3,4,5,6], 'ADDICTOID_x':['BFO:0000023', 'MF:0000....
22 Авг 2021 в 16:13
У меня есть таблица Google со списком нескольких продуктов и SKU Данные приведены ниже: title | sku | image | category | price prod1 | p1-type | 1.jpg | cat1 | 1 USD prod2 | p2-type | 2.jpg | cat2 | 2 USD prod3 | p3-type | 3.jpg | cat2 | 5 USD Я х....
20 Авг 2021 в 22:05