In [3]:
from gensim.models import AuthorTopicModel
model = AuthorTopicModel.load('model.atmodel')
In [4]:
for topic in model.show_topics(num_topics=100):
words = ''
for word, prob in model.show_topic(topic[0]):
words += word + ' '
print('Words: ' + words)
print()
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: deportesw marthadebayleenw función mesaparatodos marcaclaromvs columna_indicadorpolitico ramírez Columna # sujeto homicidio
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: reacción puedes checa tacos dejará utilizar exclusiva frase estreno ve
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: to is this columna health russia have an in_the from
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: crisis_venezuela detenido vacaciones puedes alaireconpaola El Salvador galería man spider combustible
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: joséluiscuevas identificar alaire_fm másgrandequenunca imagen_radio imageninformativa Imagen Radio actividad sujeto disculpas
Words: cdmx luis josé alaire cuevas josé_luis escribe José Luis Cuevas monterrey osorio
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: jajaja anticorrupción sistema_nacional Sistema Nacional Anticorrupción consejo aumento actividad sujeto oriente ética
Words: oncenoticias actividad ética homicidio sujeto responsables normalistas oficina policía_federal disculpas
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: a y méxico el duarte gobierno opinión javier eu vía
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: a y el trump video the años of entérate venezuela
Words: slp neza pacientes márquez llosa vargas_llosa campusnewsmilenio marcaclaromvs renato sales
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: vale despacito lujo rebase_tope actividad ética sujeto oficina normalistas disculpas
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: cristian lluvias_fuertes mil_litros comando mil litros vale porsinoloviste noesbroma telediariomatutino cristian_castro
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: pasedelista pasedelista_pm exigimos absolutamentefuerapeña xindignofuerapeña eselnarcoestado peñanietoencubridor peñanieto peñayduartesoncomplices ayotzifueelejercito
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: despiertaconloret penal sistema_justicia engéntate lasnoticiascondanielle nl decibel másvalemaña DespiertaConLoret… libreacceso
Words: leopoldolópez abu abu_bakr bakr Abu Bakr importa foroglobal identificar izzi_sky vale
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: amlo fox korrodi tv Lino Korrodi lino_korrodi lino anticorrupción amigo ayuntamiento
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: cdmx mesaparatodos puebla zócalo_cdmx bravo lugares mejores junio urgente vas
Words: levario marco_levario telefórmula Marco Levario Turcott turcott porlamañana porlamañana_fm angélica campusnewsmilenio alaire_porlamañana
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: be of_the q that sujeto oriente homicidio normalistas disculpas oficina
Words: mccartney arternativo asesinatos enlared visitaguiada estación enlared_escribe francesa recordamos sabíasque
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: that care his senate health_care as than one culpa vale
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: penal informaciónw chihuahua lesvy riña kelly carlos penal_acapulco reos homenaje
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: laotraopinión laotraopinion contraste actividad ética homicidio normalistas camioneta disculpas responsables
Words: foroglobal agendapública sujeto actividad normalistas oriente disculpas oficina asesinos ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: climammtv telediariomatutino enfoque enfoque_noticias camiones eedienteanimal carretera oficina_promociones inclusión angélica
Words: for conago leaks graves frente_amplio amplio fuerza cita entender ideas
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: laprimeramvs alaire_laprimeramvs oriente sujeto asesinos responsables oficina homicidio policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: audiontx videontx infografíantx sujeto actividad normalistas oriente ética oficina responsables
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: enpunto enpunto_mira nota_completa atandocabos zócalo_cdmx garcía mil_litros mil litros resultados impreso
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: paul mando padrastro angélica arturo marcaclaromvs abrazo forotv FOROtv Canal forotv_canal
Words: actividad normalistas oriente homicidio sujeto asesinos disculpas oficina policía_federal ética
Words: lomásyi notieress sujeto responsables oriente homicidio asesinos actividad disculpas oficina
Words: lanzó excélsiortv excélsior excélsiorinforma excélsiorinforma_excélsiortv disculpas stan_lee ética oficina normalistas
In [5]:
model.show_topics(num_topics=100)
Out[5]:
[(0,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(1,
'0.338*"deportesw" + 0.322*"marthadebayleenw" + 0.142*"función" + 0.094*"mesaparatodos" + 0.021*"marcaclaromvs" + 0.003*"columna_indicadorpolitico" + 0.002*"ramírez" + 0.002*"Columna #" + 0.000*"sujeto" + 0.000*"homicidio"'),
(2,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(3,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(4,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(5,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(6,
'0.119*"reacción" + 0.079*"puedes" + 0.077*"checa" + 0.065*"tacos" + 0.062*"dejará" + 0.060*"utilizar" + 0.058*"exclusiva" + 0.055*"frase" + 0.051*"estreno" + 0.047*"ve"'),
(7,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(8,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(9,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(10,
'0.219*"to" + 0.148*"is" + 0.046*"this" + 0.044*"columna" + 0.039*"health" + 0.038*"russia" + 0.035*"have" + 0.033*"an" + 0.032*"in_the" + 0.030*"from"'),
(11,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(12,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(13,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(14,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(15,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(16,
'0.043*"crisis_venezuela" + 0.034*"detenido" + 0.033*"vacaciones" + 0.029*"puedes" + 0.028*"alaireconpaola" + 0.028*"El Salvador" + 0.026*"galería" + 0.025*"man" + 0.023*"spider" + 0.022*"combustible"'),
(17,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(18,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(19,
'0.228*"joséluiscuevas" + 0.177*"identificar" + 0.076*"alaire_fm" + 0.063*"másgrandequenunca" + 0.061*"imagen_radio" + 0.059*"imageninformativa" + 0.057*"Imagen Radio" + 0.000*"actividad" + 0.000*"sujeto" + 0.000*"disculpas"'),
(20,
'0.070*"cdmx" + 0.036*"luis" + 0.033*"josé" + 0.031*"alaire" + 0.028*"cuevas" + 0.024*"josé_luis" + 0.024*"escribe" + 0.021*"José Luis Cuevas" + 0.020*"monterrey" + 0.012*"osorio"'),
(21,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(22,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(23,
'0.514*"jajaja" + 0.061*"anticorrupción" + 0.048*"sistema_nacional" + 0.041*"Sistema Nacional Anticorrupción" + 0.001*"consejo" + 0.001*"aumento" + 0.000*"actividad" + 0.000*"sujeto" + 0.000*"oriente" + 0.000*"ética"'),
(24,
'0.244*"oncenoticias" + 0.000*"actividad" + 0.000*"ética" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"responsables" + 0.000*"normalistas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"disculpas"'),
(25,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(26,
'0.098*"a" + 0.075*"y" + 0.030*"méxico" + 0.021*"el" + 0.013*"duarte" + 0.010*"gobierno" + 0.010*"opinión" + 0.009*"javier" + 0.009*"eu" + 0.009*"vía"'),
(27,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(28,
'0.090*"a" + 0.043*"y" + 0.037*"el" + 0.015*"trump" + 0.015*"video" + 0.014*"the" + 0.009*"años" + 0.006*"of" + 0.005*"entérate" + 0.005*"venezuela"'),
(29,
'0.282*"slp" + 0.129*"neza" + 0.078*"pacientes" + 0.062*"márquez" + 0.054*"llosa" + 0.054*"vargas_llosa" + 0.050*"campusnewsmilenio" + 0.045*"marcaclaromvs" + 0.039*"renato" + 0.039*"sales"'),
(30,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(31,
'0.376*"vale" + 0.128*"despacito" + 0.048*"lujo" + 0.000*"rebase_tope" + 0.000*"actividad" + 0.000*"ética" + 0.000*"sujeto" + 0.000*"oficina" + 0.000*"normalistas" + 0.000*"disculpas"'),
(32,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(33,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(34,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(35,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(36,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(37,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(38,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(39,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(40,
'0.077*"cristian" + 0.065*"lluvias_fuertes" + 0.059*"mil_litros" + 0.059*"comando" + 0.057*"mil litros" + 0.056*"vale" + 0.052*"porsinoloviste" + 0.047*"noesbroma" + 0.047*"telediariomatutino" + 0.045*"cristian_castro"'),
(41,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(42,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(43,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(44,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(45,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(46,
'0.102*"pasedelista" + 0.090*"pasedelista_pm" + 0.069*"exigimos" + 0.058*"absolutamentefuerapeña" + 0.058*"xindignofuerapeña" + 0.057*"eselnarcoestado" + 0.055*"peñanietoencubridor" + 0.047*"peñanieto" + 0.044*"peñayduartesoncomplices" + 0.036*"ayotzifueelejercito"'),
(47,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(48,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(49,
'0.204*"despiertaconloret" + 0.091*"penal" + 0.080*"sistema_justicia" + 0.072*"engéntate" + 0.061*"lasnoticiascondanielle" + 0.051*"nl" + 0.048*"decibel" + 0.043*"másvalemaña" + 0.039*"DespiertaConLoret…" + 0.039*"libreacceso"'),
(50,
'0.189*"leopoldolópez" + 0.125*"abu" + 0.115*"abu_bakr" + 0.115*"bakr" + 0.087*"Abu Bakr" + 0.078*"importa" + 0.053*"foroglobal" + 0.046*"identificar" + 0.024*"izzi_sky" + 0.021*"vale"'),
(51,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(52,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(53,
'0.126*"amlo" + 0.072*"fox" + 0.056*"korrodi" + 0.045*"tv" + 0.037*"Lino Korrodi" + 0.037*"lino_korrodi" + 0.037*"lino" + 0.035*"anticorrupción" + 0.033*"amigo" + 0.028*"ayuntamiento"'),
(54,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(55,
'0.159*"cdmx" + 0.084*"mesaparatodos" + 0.067*"puebla" + 0.057*"zócalo_cdmx" + 0.026*"bravo" + 0.024*"lugares" + 0.023*"mejores" + 0.023*"junio" + 0.022*"urgente" + 0.019*"vas"'),
(56,
'0.144*"levario" + 0.144*"marco_levario" + 0.123*"telefórmula" + 0.107*"Marco Levario Turcott" + 0.107*"turcott" + 0.102*"porlamañana" + 0.080*"porlamañana_fm" + 0.050*"angélica" + 0.044*"campusnewsmilenio" + 0.015*"alaire_porlamañana"'),
(57,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(58,
'0.461*"be" + 0.307*"of_the" + 0.089*"q" + 0.020*"that" + 0.000*"sujeto" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"normalistas" + 0.000*"disculpas" + 0.000*"oficina"'),
(59,
'0.144*"mccartney" + 0.112*"arternativo" + 0.110*"asesinatos" + 0.099*"enlared" + 0.095*"visitaguiada" + 0.091*"estación" + 0.082*"enlared_escribe" + 0.072*"francesa" + 0.041*"recordamos" + 0.035*"sabíasque"'),
(60,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(61,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(62,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(63,
'0.194*"that" + 0.120*"care" + 0.113*"his" + 0.106*"senate" + 0.102*"health_care" + 0.098*"as" + 0.095*"than" + 0.087*"one" + 0.037*"culpa" + 0.012*"vale"'),
(64,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(65,
'0.027*"penal" + 0.023*"informaciónw" + 0.019*"chihuahua" + 0.018*"lesvy" + 0.013*"riña" + 0.011*"kelly" + 0.010*"carlos" + 0.010*"penal_acapulco" + 0.010*"reos" + 0.009*"homenaje"'),
(66,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(67,
'0.456*"laotraopinión" + 0.303*"laotraopinion" + 0.161*"contraste" + 0.000*"actividad" + 0.000*"ética" + 0.000*"homicidio" + 0.000*"normalistas" + 0.000*"camioneta" + 0.000*"disculpas" + 0.000*"responsables"'),
(68,
'0.096*"foroglobal" + 0.052*"agendapública" + 0.000*"sujeto" + 0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"asesinos" + 0.000*"ética"'),
(69,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(70,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(71,
'0.233*"climammtv" + 0.192*"telediariomatutino" + 0.106*"enfoque" + 0.106*"enfoque_noticias" + 0.079*"camiones" + 0.057*"eedienteanimal" + 0.050*"carretera" + 0.040*"oficina_promociones" + 0.019*"inclusión" + 0.013*"angélica"'),
(72,
'0.334*"for" + 0.060*"conago" + 0.048*"leaks" + 0.047*"graves" + 0.045*"frente_amplio" + 0.045*"amplio" + 0.042*"fuerza" + 0.031*"cita" + 0.031*"entender" + 0.031*"ideas"'),
(73,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(74,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(75,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(76,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(77,
'0.653*"laprimeramvs" + 0.164*"alaire_laprimeramvs" + 0.000*"oriente" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"responsables" + 0.000*"oficina" + 0.000*"homicidio" + 0.000*"policía_federal" + 0.000*"ética"'),
(78,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(79,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(80,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(81,
'0.403*"audiontx" + 0.379*"videontx" + 0.089*"infografíantx" + 0.000*"sujeto" + 0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"ética" + 0.000*"oficina" + 0.000*"responsables"'),
(82,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(83,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(84,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(85,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(86,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(87,
'0.628*"enpunto" + 0.155*"enpunto_mira" + 0.074*"nota_completa" + 0.013*"atandocabos" + 0.008*"zócalo_cdmx" + 0.006*"garcía" + 0.004*"mil_litros" + 0.004*"mil litros" + 0.004*"resultados" + 0.001*"impreso"'),
(88,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(89,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(90,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(91,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(92,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(93,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(94,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(95,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(96,
'0.408*"paul" + 0.159*"mando" + 0.060*"padrastro" + 0.054*"angélica" + 0.050*"arturo" + 0.043*"marcaclaromvs" + 0.038*"abrazo" + 0.022*"forotv" + 0.020*"FOROtv Canal" + 0.020*"forotv_canal"'),
(97,
'0.000*"actividad" + 0.000*"normalistas" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"sujeto" + 0.000*"asesinos" + 0.000*"disculpas" + 0.000*"oficina" + 0.000*"policía_federal" + 0.000*"ética"'),
(98,
'0.707*"lomásyi" + 0.243*"notieress" + 0.000*"sujeto" + 0.000*"responsables" + 0.000*"oriente" + 0.000*"homicidio" + 0.000*"asesinos" + 0.000*"actividad" + 0.000*"disculpas" + 0.000*"oficina"'),
(99,
'0.400*"lanzó" + 0.156*"excélsiortv" + 0.089*"excélsior" + 0.059*"excélsiorinforma" + 0.044*"excélsiorinforma_excélsiortv" + 0.000*"disculpas" + 0.000*"stan_lee" + 0.000*"ética" + 0.000*"oficina" + 0.000*"normalistas"')]
In [3]:
%%time
from sklearn.manifold import TSNE
tsne = TSNE(n_components=2, random_state=0)
smallest_author = 0 # Ignore authors with documents less than this.
authors = [model.author2id[a] for a in model.author2id.keys() if len(model.author2doc[a]) >= smallest_author]
_ = tsne.fit_transform(model.state.gamma[authors, :]) # Result stored in tsne.embedding_
Wall time: 1.45 s
In [5]:
from bokeh.models import HoverTool
from bokeh.plotting import figure, show, ColumnDataSource
x = tsne.embedding_[:, 0]
y = tsne.embedding_[:, 1]
author_names = [model.id2author[a] for a in authors]
scale = 0.01
author_sizes = [len(model.author2doc[a]) for a in author_names]
radii = [size * scale for size in author_sizes]
source = ColumnDataSource(
data=dict(
x=x,
y=y,
author_names=author_names,
author_sizes=author_sizes,
radii=radii,
)
)
hover = HoverTool(
tooltips=[
("author", "@author_names"),
("size", "@author_sizes"),
]
)
p = figure(tools=[hover, 'crosshair,pan,wheel_zoom,box_zoom,reset,save,lasso_select'])
p.scatter('x', 'y', radius='radii', source=source, fill_alpha=0.6, line_color=None)
show(p)
In [6]:
from gensim.similarities import MatrixSimilarity
index = MatrixSimilarity(model[list(model.id2author.values())])
In [7]:
from gensim import matutils
import pandas as pd
author_vecs = [model.get_author_topics(author) for author in model.id2author.values()]
def similarity(vec1, vec2):
dist = matutils.hellinger(matutils.sparse2full(vec1, model.num_topics), \
matutils.sparse2full(vec2, model.num_topics))
sim = 1.0 / (1.0 + dist)
return sim
def get_sims(vec):
sims = [similarity(vec, vec2) for vec2 in author_vecs]
return sims
def get_table(name, top_n=10, smallest_author=1):
sims = get_sims(model.get_author_topics(name))
table = []
for elem in enumerate(sims):
author_name = model.id2author[elem[0]]
sim = elem[1]
author_size = len(model.author2doc[author_name])
if author_size >= smallest_author:
table.append((author_name, sim, author_size))
df = pd.DataFrame(table, columns=['Author', 'Score', 'Size'])
df = df.sort_values('Score', ascending=False)[:top_n]
return df
In [8]:
get_table('caudillomx')
Out[8]:
Author
Score
Size
87
caudillomx
1.000000
8
28
FedericoArreola
0.993058
89
85
carloselizondom
0.989338
50
7
AztecaNoticias
0.938794
69
82
arturoangel20
0.927304
136
117
leozuckermann
0.924208
15
13
DeniseDresserG
0.918693
54
0
ADNPolitico
0.903563
420
63
SalCamarena
0.890209
37
78
almorenoal
0.889025
25
In [ ]:
Content source: jadm333/aut-top
Similar notebooks: