In [1]:
using DataFrames
df = readtable("data/postags.csv");
In [2]:
nouns = Int[]
verbs = Int[]
adjvs = Int[]
for i=1:size(df,1)
if startswith(df[i, 2], "NN")
push!(nouns, i)
elseif startswith(df[i, 2], "VB")
push!(verbs, i)
elseif startswith(df[i, 2], "JJ")
push!(adjvs, i)
end
end
nns = df[nouns, :]
vbs = df[verbs, :]
adjs = df[adjvs, :]
sort!(nns, cols=:count, rev=true);
sort!(vbs, cols=:count, rev=true);
sort!(adjs, cols=:count, rev=true);
In [3]:
showall(vbs)
100×3 DataFrames.DataFrame
│ Row │ word │ tag │ count │
├─────┼────────────────┼───────┼───────┤
│ 1 │ "left" │ "VBD" │ 721 │
│ 2 │ "go" │ "VB" │ 654 │
│ 3 │ "is" │ "VBZ" │ 311 │
│ 4 │ "take" │ "VB" │ 261 │
│ 5 │ "be" │ "VB" │ 142 │
│ 6 │ "follow" │ "VB" │ 100 │
│ 7 │ "see" │ "VB" │ 95 │
│ 8 │ "floored" │ "VBD" │ 73 │
│ 9 │ "are" │ "VBP" │ 68 │
│ 10 │ "reach" │ "VBP" │ 60 │
│ 11 │ "make" │ "VB" │ 58 │
│ 12 │ "containing" │ "VBG" │ 54 │
│ 13 │ "passing" │ "VBG" │ 50 │
│ 14 │ "get" │ "VBP" │ 41 │
│ 15 │ "facing" │ "VBG" │ 39 │
│ 16 │ "contains" │ "VBZ" │ 33 │
│ 17 │ "rose" │ "VBD" │ 28 │
│ 18 │ "has" │ "VBZ" │ 25 │
│ 19 │ "stop" │ "VB" │ 22 │
│ 20 │ "keep" │ "VB" │ 20 │
│ 21 │ "have" │ "VB" │ 20 │
│ 22 │ "ends" │ "VBZ" │ 18 │
│ 23 │ "come" │ "VBP" │ 18 │
│ 24 │ "going" │ "VBG" │ 18 │
│ 25 │ "intersects" │ "VBZ" │ 14 │
│ 26 │ "pass" │ "VB" │ 14 │
│ 27 │ "tiled" │ "VBD" │ 11 │
│ 28 │ "walled" │ "VBD" │ 10 │
│ 29 │ "find" │ "VB" │ 9 │
│ 30 │ "intersect" │ "VBP" │ 9 │
│ 31 │ "looking" │ "VBG" │ 8 │
│ 32 │ "contain" │ "VB" │ 8 │
│ 33 │ "hit" │ "VBP" │ 8 │
│ 34 │ "turning" │ "VBG" │ 6 │
│ 35 │ "til" │ "VBP" │ 5 │
│ 36 │ "carpeted" │ "VBD" │ 5 │
│ 37 │ "believe" │ "VBP" │ 5 │
│ 38 │ "continue" │ "VB" │ 5 │
│ 39 │ "standing" │ "VBG" │ 4 │
│ 40 │ "meets" │ "VBZ" │ 4 │
│ 41 │ "meet" │ "VB" │ 4 │
│ 42 │ "came" │ "VBD" │ 3 │
│ 43 │ "put" │ "VBD" │ 3 │
│ 44 │ "do" │ "VB" │ 3 │
│ 45 │ "form" │ "VBD" │ 3 │
│ 46 │ "intersecting" │ "VBG" │ 3 │
│ 47 │ "travel" │ "VB" │ 2 │
│ 48 │ "located" │ "VBN" │ 2 │
│ 49 │ "start" │ "VBP" │ 2 │
│ 50 │ "enter" │ "VBP" │ 2 │
│ 51 │ "think" │ "VBP" │ 2 │
│ 52 │ "appears" │ "VBZ" │ 2 │
│ 53 │ "having" │ "VBG" │ 2 │
│ 54 │ "leading" │ "VBG" │ 2 │
│ 55 │ "ending" │ "VBG" │ 1 │
│ 56 │ "conataining" │ "VBG" │ 1 │
│ 57 │ "contained" │ "VBN" │ 1 │
│ 58 │ "wth" │ "VBD" │ 1 │
│ 59 │ "interesects" │ "VBZ" │ 1 │
│ 60 │ "locate" │ "VB" │ 1 │
│ 61 │ "'t's" │ "VBZ" │ 1 │
│ 62 │ "continuing" │ "VBG" │ 1 │
│ 63 │ "conatains" │ "VBZ" │ 1 │
│ 64 │ "makes" │ "VBZ" │ 1 │
│ 65 │ "reached" │ "VBN" │ 1 │
│ 66 │ "containg" │ "VBG" │ 1 │
│ 67 │ "resume" │ "VB" │ 1 │
│ 68 │ "covered" │ "VBN" │ 1 │
│ 69 │ "whne" │ "VBP" │ 1 │
│ 70 │ "flooored" │ "VBD" │ 1 │
│ 71 │ "goi" │ "VB" │ 1 │
│ 72 │ "crosses" │ "VBZ" │ 1 │
│ 73 │ "towars" │ "VBZ" │ 1 │
│ 74 │ "ti" │ "VBZ" │ 1 │
│ 75 │ "-floored" │ "VBN" │ 1 │
│ 76 │ "amek" │ "VB" │ 1 │
│ 77 │ "finding" │ "VBG" │ 1 │
│ 78 │ "epink" │ "VBP" │ 1 │
│ 79 │ "conatins" │ "VBZ" │ 1 │
│ 80 │ "am" │ "VBP" │ 1 │
│ 81 │ "was" │ "VBD" │ 1 │
│ 82 │ "pst" │ "VBZ" │ 1 │
│ 83 │ "wil" │ "VBP" │ 1 │
│ 84 │ "tke" │ "VB" │ 1 │
│ 85 │ "view" │ "VB" │ 1 │
│ 86 │ "branching" │ "VBG" │ 1 │
│ 87 │ "leads" │ "VBZ" │ 1 │
│ 88 │ "hang" │ "VBD" │ 1 │
│ 89 │ "brings" │ "VBZ" │ 1 │
│ 90 │ "placed" │ "VBN" │ 1 │
│ 91 │ "faces" │ "VBZ" │ 1 │
│ 92 │ "followed" │ "VBN" │ 1 │
│ 93 │ "ended" │ "VBN" │ 1 │
│ 94 │ "moving" │ "VBG" │ 1 │
│ 95 │ "foored" │ "VBD" │ 1 │
│ 96 │ "intersected" │ "VBN" │ 1 │
│ 97 │ "fail" │ "VBP" │ 1 │
│ 98 │ "opens" │ "VBZ" │ 1 │
│ 99 │ "branches" │ "VBZ" │ 1 │
│ 100 │ "rech" │ "VBP" │ 1 │
In [4]:
showall(nns)
205×3 DataFrames.DataFrame
│ Row │ word │ tag │ count │
├─────┼───────────────────┼───────┼───────┤
│ 1 │ "turn" │ "NN" │ 921 │
│ 2 │ "right" │ "NN" │ 672 │
│ 3 │ "hall" │ "NN" │ 661 │
│ 4 │ "intersection" │ "NN" │ 497 │
│ 5 │ "walk" │ "NN" │ 431 │
│ 6 │ "move" │ "NN" │ 312 │
│ 7 │ "path" │ "NN" │ 308 │
│ 8 │ "end" │ "NN" │ 287 │
│ 9 │ "easel" │ "NN" │ 216 │
│ 10 │ "segment" │ "NN" │ 189 │
│ 11 │ "chair" │ "NN" │ 182 │
│ 12 │ "wall" │ "NN" │ 177 │
│ 13 │ "carpet" │ "NN" │ 173 │
│ 14 │ "brick" │ "NN" │ 163 │
│ 15 │ "hallway" │ "NN" │ 158 │
│ 16 │ "alley" │ "NN" │ 152 │
│ 17 │ "back" │ "NN" │ 140 │
│ 18 │ "face" │ "NN" │ 134 │
│ 19 │ "lamp" │ "NN" │ 130 │
│ 20 │ "segments" │ "NNS" │ 127 │
│ 21 │ "floor" │ "NN" │ 121 │
│ 22 │ "hatrack" │ "NN" │ 107 │
│ 23 │ "position" │ "NN" │ 103 │
│ 24 │ "pink" │ "NN" │ 100 │
│ 25 │ "corner" │ "NN" │ 91 │
│ 26 │ "way" │ "NN" │ 90 │
│ 27 │ "stone" │ "NN" │ 74 │
│ 28 │ "bench" │ "NN" │ 73 │
│ 29 │ "twice" │ "NN" │ 73 │
│ 30 │ "stool" │ "NN" │ 68 │
│ 31 │ "times" │ "NNS" │ 67 │
│ 32 │ "rack" │ "NN" │ 63 │
│ 33 │ "concrete" │ "NN" │ 62 │
│ 34 │ "side" │ "NN" │ 61 │
│ 35 │ "grey" │ "NN" │ 61 │
│ 36 │ "wood" │ "NN" │ 61 │
│ 37 │ "bare" │ "NN" │ 58 │
│ 38 │ "flooring" │ "NN" │ 52 │
│ 39 │ "area" │ "NN" │ 48 │
│ 40 │ "place" │ "NN" │ 43 │
│ 41 │ "pictures" │ "NNS" │ 41 │
│ 42 │ "coat" │ "NN" │ 41 │
│ 43 │ "front" │ "NN" │ 40 │
│ 44 │ "walls" │ "NNS" │ 39 │
│ 45 │ "octagon" │ "NN" │ 39 │
│ 46 │ "fish" │ "NN" │ 38 │
│ 47 │ "floors" │ "NNS" │ 34 │
│ 48 │ "grassy" │ "NN" │ 30 │
│ 49 │ "block" │ "NN" │ 30 │
│ 50 │ "butterflies" │ "NNS" │ 28 │
│ 51 │ "alleys" │ "NNS" │ 27 │
│ 52 │ "middle" │ "NN" │ 25 │
│ 53 │ "sofa" │ "NN" │ 23 │
│ 54 │ "foward" │ "NN" │ 23 │
│ 55 │ "butterfly" │ "NN" │ 23 │
│ 56 │ "plain" │ "NN" │ 22 │
│ 57 │ "eiffel" │ "NN" │ 22 │
│ 58 │ "grass" │ "NN" │ 22 │
│ 59 │ "hat" │ "NN" │ 21 │
│ 60 │ "orient" │ "NN" │ 21 │
│ 61 │ "aesal" │ "NN" │ 21 │
│ 62 │ "tower" │ "NN" │ 20 │
│ 63 │ "cement" │ "NN" │ 19 │
│ 64 │ "movement" │ "NN" │ 18 │
│ 65 │ "section" │ "NN" │ 16 │
│ 66 │ "furniture" │ "NN" │ 16 │
│ 67 │ "pos" │ "NN" │ 15 │
│ 68 │ "halls" │ "NNS" │ 14 │
│ 69 │ "space" │ "NN" │ 14 │
│ 70 │ "direction" │ "NN" │ 14 │
│ 71 │ "look" │ "NN" │ 14 │
│ 72 │ "towers" │ "NNS" │ 12 │
│ 73 │ "rt" │ "NN" │ 11 │
│ 74 │ "road" │ "NN" │ 11 │
│ 75 │ "spaces" │ "NNS" │ 11 │
│ 76 │ "corridor" │ "NN" │ 11 │
│ 77 │ "winding" │ "NN" │ 10 │
│ 78 │ "it's" │ "NN" │ 10 │
│ 79 │ "spot" │ "NN" │ 9 │
│ 80 │ "i" │ "NN" │ 9 │
│ 81 │ "aisle" │ "NN" │ 8 │
│ 82 │ "hallways" │ "NNS" │ 8 │
│ 83 │ "blocks" │ "NNS" │ 8 │
│ 84 │ "square" │ "NN" │ 7 │
│ 85 │ "steps" │ "NNS" │ 7 │
│ 86 │ "street" │ "NN" │ 7 │
│ 87 │ "teh" │ "NN" │ 7 │
│ 88 │ "interesection" │ "NN" │ 6 │
│ 89 │ "sections" │ "NNS" │ 6 │
│ 90 │ "branch" │ "NN" │ 6 │
│ 91 │ "head" │ "NN" │ 6 │
│ 92 │ "sides" │ "NNS" │ 6 │
│ 93 │ "intersections" │ "NNS" │ 6 │
│ 94 │ "objects" │ "NNS" │ 5 │
│ 95 │ "butterflys" │ "NN" │ 5 │
│ 96 │ "flowers" │ "NNS" │ 5 │
│ 97 │ "w/" │ "NN" │ 5 │
│ 98 │ "tiles" │ "NNS" │ 4 │
│ 99 │ "deadend" │ "NN" │ 4 │
│ 100 │ "room" │ "NN" │ 4 │
│ 101 │ "junction" │ "NN" │ 4 │
│ 102 │ "postion" │ "NN" │ 4 │
│ 103 │ "portion" │ "NN" │ 4 │
│ 104 │ "pieces" │ "NNS" │ 4 │
│ 105 │ "piece" │ "NN" │ 3 │
│ 106 │ "distance" │ "NN" │ 3 │
│ 107 │ "point" │ "NN" │ 3 │
│ 108 │ "carpeting" │ "NN" │ 3 │
│ 109 │ "pnk" │ "NN" │ 3 │
│ 110 │ "patch" │ "NN" │ 3 │
│ 111 │ "juncture" │ "NN" │ 3 │
│ 112 │ "octagons" │ "NNS" │ 3 │
│ 113 │ "walkway" │ "NN" │ 3 │
│ 114 │ "p" │ "NN" │ 3 │
│ 115 │ "tile" │ "NN" │ 3 │
│ 116 │ "rock" │ "NN" │ 3 │
│ 117 │ "paths" │ "NNS" │ 3 │
│ 118 │ "interesction" │ "NN" │ 2 │
│ 119 │ "whe" │ "NN" │ 2 │
│ 120 │ "goin" │ "NN" │ 2 │
│ 121 │ "nothing" │ "NN" │ 2 │
│ 122 │ "choice" │ "NN" │ 2 │
│ 123 │ "expanse" │ "NN" │ 2 │
│ 124 │ "stand" │ "NN" │ 2 │
│ 125 │ "something" │ "NN" │ 2 │
│ 126 │ "interection" │ "NN" │ 2 │
│ 127 │ "stay" │ "NN" │ 2 │
│ 128 │ "pics" │ "NNS" │ 2 │
│ 129 │ "turns" │ "NNS" │ 2 │
│ 130 │ "ahllway" │ "NN" │ 2 │
│ 131 │ "ways" │ "NNS" │ 2 │
│ 132 │ "areas" │ "NNS" │ 2 │
│ 133 │ "segements" │ "NNS" │ 2 │
│ 134 │ "movements" │ "NNS" │ 2 │
│ 135 │ "sort" │ "NN" │ 2 │
│ 136 │ "pole" │ "NN" │ 2 │
│ 137 │ "flor" │ "NN" │ 2 │
│ 138 │ "that's" │ "NN" │ 2 │
│ 139 │ "honeycomb" │ "NN" │ 2 │
│ 140 │ "object" │ "NN" │ 2 │
│ 141 │ "streets" │ "NNS" │ 2 │
│ 142 │ "step" │ "NN" │ 1 │
│ 143 │ "wiht" │ "NN" │ 1 │
│ 144 │ "thing" │ "NN" │ 1 │
│ 145 │ "florr" │ "NN" │ 1 │
│ 146 │ "roses" │ "NNS" │ 1 │
│ 147 │ "butterlfy" │ "NN" │ 1 │
│ 148 │ "futon/bench" │ "NN" │ 1 │
│ 149 │ "tiems" │ "NNS" │ 1 │
│ 150 │ "unti" │ "NNS" │ 1 │
│ 151 │ "roack" │ "NN" │ 1 │
│ 152 │ "pictures;" │ "NN" │ 1 │
│ 153 │ "hallwyas" │ "NN" │ 1 │
│ 154 │ "ahllways" │ "NNS" │ 1 │
│ 155 │ "top" │ "NN" │ 1 │
│ 156 │ "pieaces" │ "NNS" │ 1 │
│ 157 │ "hanging" │ "NN" │ 1 │
│ 158 │ "click" │ "NN" │ 1 │
│ 159 │ "buterfly" │ "NN" │ 1 │
│ 160 │ "pcitures" │ "NNS" │ 1 │
│ 161 │ "opening" │ "NN" │ 1 │
│ 162 │ "p-7" │ "NN" │ 1 │
│ 163 │ "id" │ "NN" │ 1 │
│ 164 │ "tilll" │ "NN" │ 1 │
│ 165 │ "lft" │ "NN" │ 1 │
│ 166 │ "flower" │ "NN" │ 1 │
│ 167 │ "furnitute" │ "NN" │ 1 │
│ 168 │ "series" │ "NN" │ 1 │
│ 169 │ "coatrack" │ "NN" │ 1 │
│ 170 │ "segmentsm" │ "NN" │ 1 │
│ 171 │ "fave" │ "NN" │ 1 │
│ 172 │ "walled/blue" │ "NN" │ 1 │
│ 173 │ "stem" │ "NN" │ 1 │
│ 174 │ "interseciton" │ "NN" │ 1 │
│ 175 │ "doesn't" │ "NN" │ 1 │
│ 176 │ "hangings" │ "NNS" │ 1 │
│ 177 │ "lampl" │ "NN" │ 1 │
│ 178 │ "inersection" │ "NN" │ 1 │
│ 179 │ "halllway" │ "NN" │ 1 │
│ 180 │ "wawya" │ "NN" │ 1 │
│ 181 │ "spce" │ "NN" │ 1 │
│ 182 │ "oine" │ "NN" │ 1 │
│ 183 │ "images" │ "NNS" │ 1 │
│ 184 │ "hal" │ "NN" │ 1 │
│ 185 │ "course" │ "NN" │ 1 │
│ 186 │ "fwd" │ "NN" │ 1 │
│ 187 │ "crossing" │ "NN" │ 1 │
│ 188 │ "directions" │ "NNS" │ 1 │
│ 189 │ "not-butterflies" │ "NNS" │ 1 │
│ 190 │ "sure" │ "NN" │ 1 │
│ 191 │ "doen" │ "NN" │ 1 │
│ 192 │ "p-6" │ "NN" │ 1 │
│ 193 │ "postition" │ "NN" │ 1 │
│ 194 │ "bar" │ "NN" │ 1 │
│ 195 │ "intesection" │ "NN" │ 1 │
│ 196 │ "route" │ "NN" │ 1 │
│ 197 │ "exit" │ "NN" │ 1 │
│ 198 │ "intersectino" │ "NN" │ 1 │
│ 199 │ "laft" │ "NN" │ 1 │
│ 200 │ "tinto" │ "NN" │ 1 │
│ 201 │ "lampshade" │ "NN" │ 1 │
│ 202 │ "couple" │ "NN" │ 1 │
│ 203 │ "tunr" │ "NN" │ 1 │
│ 204 │ "bvlue" │ "NN" │ 1 │
│ 205 │ "chairs" │ "NNS" │ 1 │
In [5]:
showall(adjs)
79×3 DataFrames.DataFrame
│ Row │ word │ tag │ count │
├─────┼──────────────────┼───────┼───────┤
│ 1 │ "blue" │ "JJ" │ 209 │
│ 2 │ "red" │ "JJ" │ 144 │
│ 3 │ "yellow" │ "JJ" │ 110 │
│ 4 │ "black" │ "JJ" │ 90 │
│ 5 │ "blue-tiled" │ "JJ" │ 80 │
│ 6 │ "next" │ "JJ" │ 71 │
│ 7 │ "pink-flowered" │ "JJ" │ 54 │
│ 8 │ "first" │ "JJ" │ 54 │
│ 9 │ "green" │ "JJ" │ 53 │
│ 10 │ "flowered" │ "JJ" │ 53 │
│ 11 │ "yellow-tiled" │ "JJ" │ 51 │
│ 12 │ "dead" │ "JJ" │ 50 │
│ 13 │ "wooden" │ "JJ" │ 40 │
│ 14 │ "empty" │ "JJ" │ 26 │
│ 15 │ "long" │ "JJ" │ 26 │
│ 16 │ "wooden-floored" │ "JJ" │ 22 │
│ 17 │ "longer" │ "JJR" │ 19 │
│ 18 │ "gray" │ "JJ" │ 16 │
│ 19 │ "brown" │ "JJ" │ 14 │
│ 20 │ "second" │ "JJ" │ 13 │
│ 21 │ "other" │ "JJ" │ 11 │
│ 22 │ "short" │ "JJ" │ 7 │
│ 23 │ "opposite" │ "JJ" │ 6 │
│ 24 │ "shorter" │ "JJR" │ 6 │
│ 25 │ "immediate" │ "JJ" │ 5 │
│ 26 │ "visible" │ "JJ" │ 5 │
│ 27 │ "painting" │ "JJ" │ 5 │
│ 28 │ "able" │ "JJ" │ 5 │
│ 29 │ "last" │ "JJ" │ 4 │
│ 30 │ "perpendicular" │ "JJ" │ 3 │
│ 31 │ "farthest" │ "JJS" │ 3 │
│ 32 │ "same" │ "JJ" │ 3 │
│ 33 │ "blank" │ "JJ" │ 3 │
│ 34 │ "tward" │ "JJ" │ 2 │
│ 35 │ "previous" │ "JJ" │ 2 │
│ 36 │ "stone-floored" │ "JJ" │ 2 │
│ 37 │ "more" │ "JJR" │ 2 │
│ 38 │ "tot" │ "JJ" │ 2 │
│ 39 │ "th" │ "JJ" │ 2 │
│ 40 │ "hexagonal" │ "JJ" │ 2 │
│ 41 │ "following" │ "JJ" │ 2 │
│ 42 │ "white" │ "JJ" │ 2 │
│ 43 │ "few" │ "JJ" │ 2 │
│ 44 │ "closer" │ "JJR" │ 1 │
│ 45 │ "regular" │ "JJ" │ 1 │
│ 46 │ "p-3" │ "JJ" │ 1 │
│ 47 │ "many" │ "JJ" │ 1 │
│ 48 │ "solid" │ "JJ" │ 1 │
│ 49 │ "vacant" │ "JJ" │ 1 │
│ 50 │ "charred" │ "JJ" │ 1 │
│ 51 │ "possible" │ "JJ" │ 1 │
│ 52 │ "several" │ "JJ" │ 1 │
│ 53 │ "such" │ "JJ" │ 1 │
│ 54 │ "single" │ "JJ" │ 1 │
│ 55 │ "red-bricked" │ "JJ" │ 1 │
│ 56 │ "walked" │ "JJ" │ 1 │
│ 57 │ "intersection;" │ "JJ" │ 1 │
│ 58 │ "key" │ "JJ" │ 1 │
│ 59 │ "normal" │ "JJ" │ 1 │
│ 60 │ "brick-floored" │ "JJ" │ 1 │
│ 61 │ "lovely" │ "JJ" │ 1 │
│ 62 │ "certain" │ "JJ" │ 1 │
│ 63 │ "third" │ "JJ" │ 1 │
│ 64 │ "olive" │ "JJ" │ 1 │
│ 65 │ "orange" │ "JJ" │ 1 │
│ 66 │ "perspective" │ "JJ" │ 1 │
│ 67 │ "colored" │ "JJ" │ 1 │
│ 68 │ "t" │ "JJ" │ 1 │
│ 69 │ "monarch" │ "JJ" │ 1 │
│ 70 │ "wood-floored" │ "JJ" │ 1 │
│ 71 │ "dark" │ "JJ" │ 1 │
│ 72 │ "flowerd" │ "JJ" │ 1 │
│ 73 │ "longetr" │ "JJ" │ 1 │
│ 74 │ "fishy" │ "JJ" │ 1 │
│ 75 │ "efficient" │ "JJ" │ 1 │
│ 76 │ "pink-carpeted" │ "JJ" │ 1 │
│ 77 │ "fourth" │ "JJ" │ 1 │
│ 78 │ "wooden-tiled" │ "JJ" │ 1 │
│ 79 │ "floord" │ "JJ" │ 1 │
In [ ]:
Content source: ozanarkancan/navigation
Similar notebooks: