сгруппируйте пользователей и найдите трех наиболее упомянутых пользователей в R
У меня есть фрейм данныхdf
только с одним столбцомmentions
.
mentions
_________
1 @one
2 @two
3 @one
4 @four
...
Я хочу найти самого упоминаемого пользователя. Я пыталсяgroup_by(df)
но это ничего не меняет.

2 ответа
rev(sort(table(df$mentions)))[1]
Путаница здесь возникает из-за того, что group by сообщает R, как применять следующие несколько вычислений. Это означает, что мы действительно хотим считать, используя группу упоминаний.
Я бы предложил использовать%>%
функция, за которой следуетcount()
.
Ниже я привел воспроизводимый пример:
library(tidyverse)
df <- tribble(~L,
"a",
"a",
"a",
"a",
"a",
"b",
"b",
"b",
"b",
"c",
"c",
"c",
"c",
"c")
df %>%
group_by(L) %>%
count() %>%
arrange(desc(n))
Попробуйте это, но замените df и L на ваш df и упомяните, как это будут ваши данные.
Другие вопросы
- Как сделать group_concat в двух полях в sqlite2 ответ
Мойcities Таблица:year | id | city 2005 10 LA 2005 11 SF 2007 12 NY 2008 13 NO с запросом:SELECT year, GROUP_CONCAT(id) FROM cities GROUP BY year Получаю вывод:2005|10,11 2007|12 2008|13 Но я бы хотел получить что-то вроде (например):2005|10,LA,11,SF 2007|12,NY 2008|13,NO Друг...
- Моя горизонтальная полоса обрезает текст, когда я сохраняю изображение. Как сделать полосы короче, а текст длиннее?1 ответ
Я новичок в R, так что простите мое невежество. Итак, я создал базовую горизонтальную гистограмму, используяbarplot( ). Мой текст на оси Y в основном исчезает. [IMG_OUR_ID=67.png] [IMG_OUR_ID=68.png] Есть ли способ удлинить и отобразить текст? Это мой код:barplot(mydata$`Sum Impact Risk`~mydata$`Eco...
- Почему case_when () вычисляет ложное условие?3 ответ
У меня есть data.frame с групповой переменной и целочисленной переменной с отсутствующими данными.df<-data.frame(group=c(1,1,2,2,3,3),a=as.integer(c(1,2,NA,NA,1,NA))) Я хочу вычислить максимально доступное значение переменнойa внутри каждой группы: в моем примере я должен получить 2 для группы 1...
- Удаление повторяющихся строк на основе самой последней записи3 ответ
Приношу свои извинения, поскольку я знаю, что варианты этого вопроса задавались раньше, но я попытался найти предоставленные ответы и не смог применить их к своим данным. У меня есть следующие данные по результатам опроса. Несколько человек прошли опросы для участия в различных вебинарах. Человек мо...
- Объедините набор переменных списка в фрейм данных, используя список, который ссылается на эти переменные списка1 ответ
Это было сложно сформулировать, поэтому создали пример. У меня есть набор переменных списка, которые я хотел бы объединить в фрейм данных. Это примеры списковa <- 2:7 b <- 9:14 c <- 25:30 d <- 31:36 У меня есть список, в котором есть элементы, которые ссылаются на приведенные выше имен...
- Я хочу добавить процент подсчета для каждой категории в качестве метки на мою круговую диаграмму ggplot1 ответ
Я использую код:age_pie_chart <- ggplot(data = data , aes(x = "", fill = `Q1: How old are you?`))+ geom_bar(position = "fill", width = 1) + coord_polar(theta = "y") + xlab("") + ylab("") + blank_theme + scale_fill_grey()+ theme(axis.text.x...
- Как вернуться к старому фрейму данных при удалении вновь добавленного столбца?1 ответ
Проблема Я объединил большое количество наборов данных в один фрейм данных. Затем я хочу использовать этот большой фрейм данных во всем своем коде. Однако иногда я хочу использовать только один из более мелких ранних наборов данных, но делать это с моим существующим большим фреймом данных. Я чувству...
- Обновляет data.table при передаче в качестве аргумента функции2 ответ
Когда я передаю data.table в качестве аргумента функции, я могу обновить эту таблицу «по ссылке» в вызываемой функции, и результаты будут применены к исходному объекту. Однако, если я делаю что-то, что требует «глубокой копии» (например, rbindlist для добавления строк), копия существует только в выз...
- Сгруппированный фильтр на основе нескольких столбцов2 ответ
У меня есть фрейм данных с 71 группой, 4 наблюдениями на группу и 18 переменными. Я хотел бы удалить всю группу, если какое-либо наблюдение в этой группе имеет меньше определенного значения в любой из 4 различных переменных, каждая из которых содержит одну и ту же строку в своем имени. Вот упрощенна...
- конкретный шаблон и позиция gsub в символьной строке1 ответ
Это, вероятно, довольно простое исправление, но я не так хорошо разбираюсь в RegExpr, как было бы идеально, поэтому помощь приветствуется. Я искал в другом месте, и у меня ничего не работает. Я пытаюсь стандартизировать некоторые названия университетских степеней. Мне нужен такой формат: Код ученой ...

"Завидую тестировщикам: все хотят с ними дружить."
df %>% group_by(mentions) %>% summarise(n = n()) newdf <- df[order(df$n, decreasing = TRUE),] head(newdf, 1)
Nataliia Yefimova