dist_df 만들기


In [1]:
df = pd.read_csv('../resource/preprocess_df1.csv')
df


Out[1]:
영화 내 별점(y) 평균별점 이동진 별점 평가자수 보고싶어요수 코멘트수 감독 배우 등급 장르 국가 상영시간 년도 별점분포 이동진 코멘트
0 스포트라이트 3.5 4.22683 4.5 13,025 9,796 2,585 토마스 맥카시 [마이클 키튼, 마크 러팔로, 레이첼 맥아담스] 15세 관람가 드라마 미국 128 2015 {"1":7,"2":14,"3":10,"4":50,"5":83,"6":454,"7"... '모두가 대통령의 사람들'과 함께 오래도록 거론될 모범적 언론영화.
1 찌라시 : 위험한 소문 2.5 2.99629 NaN 58,122 3,166 965 김광식 [김강우, 정진영, 박성웅] 15세 관람가 드라마 한국 121 2013 {"1":1312,"2":2150,"3":2238,"4":6597,"5":6749,... NaN
2 비포 미드나잇 4.0 3.90119 NaN 66,296 33,565 1,539 리처드 링클레이터 [에단 호크, 줄리 델피, 시머스 데이비-피츠패트릭] 청소년 관람불가 로맨스/멜로 미국 108 2013 {"1":228,"2":956,"3":316,"4":2367,"5":1513,"6"... NaN
3 더 웹툰: 예고살인 2.0 2.62241 NaN 67,031 1,079 712 김용균 [이시영, 엄기준, 문가영] 15세 관람가 공포 한국 104 2013 {"1":3615,"2":5424,"3":4063,"4":11525,"5":8133... NaN
4 트랜센던스 3.0 3.31175 NaN 68,174 9,510 2,439 월리 피스터 [조니 뎁, 레베카 홀, 모건 프리먼] 12세 관람가 SF 미국, 영국 119 2014 {"1":787,"2":1329,"3":1612,"4":5251,"5":6635,"... NaN
5 인간중독 2.0 2.27068 NaN 71,711 1,780 1,801 김대우 [송승헌, 임지연, 온주완] 청소년 관람불가 드라마 한국 132 2014 {"1":6464,"2":7810,"3":7653,"4":15110,"5":9750... NaN
6 헝거게임: 모킹제이 2.5 3.52048 NaN 74,705 7,661 2,829 프란시스 로렌스 [제니퍼 로렌스, 리암 헴스워스, 조쉬 허처슨] 15세 관람가 판타지 미국 123 2014 {"1":627,"2":895,"3":994,"4":3262,"5":5484,"6"... NaN
7 인턴 3.5 3.90317 NaN 74,444 10,389 7,696 낸시 마이어스 [로버트 드 니로, 앤 해서웨이, 르네 루소] 12세 관람가 코미디 미국 121 2015 {"1":68,"2":134,"3":215,"4":892,"5":2333,"6":8... NaN
8 뷰티 인사이드 2.0 3.61165 NaN 78,615 6,108 7,895 백종열 [이현우, 한효주, 김대명] 12세 관람가 로맨스/멜로 한국 127 2015 {"1":294,"2":475,"3":764,"4":2612,"5":5541,"6"... NaN
9 검은 사제들 4.0 3.60711 NaN 79,275 4,026 7,954 장재현 [김윤석, 강동원, 박소담] 15세 관람가 스릴러 한국 108 2015 {"1":268,"2":398,"3":495,"4":1916,"5":4124,"6"... NaN
10 내부자들 4.5 3.86041 NaN 81,082 5,085 8,404 우민호 [이병헌, 조승우, 백윤식] 청소년 관람불가 범죄 한국 130 2015 {"1":159,"2":244,"3":280,"4":1133,"5":2816,"6"... NaN
11 사일런트 힐 3.0 3.34497 NaN 83,358 5,629 841 크리스토프 갱스 [라다 미첼, 로리 홀든, 숀 빈] 청소년 관람불가 공포 캐나다, 일본, 미국, 프랑스 124 2006 {"1":833,"2":3363,"3":1109,"4":8095,"5":3894,"... NaN
12 마션 3.5 4.01025 4.0 93,331 8,067 10,234 리들리 스콧 [맷 데이먼, 제시카 차스테인, 제프 다니엘스] 12세 관람가 SF 미국 142 2015 {"1":69,"2":141,"3":186,"4":691,"5":1441,"6":6... 하나를 위한 전체. 세상에서 가장 낙천적인 (SF)재난영화.
13 시간 여행자의 아내 3.0 3.66282 NaN 96,957 21,133 1,044 로베르트 슈벤트케 [에릭 바나, 레이첼 맥아담스, 알렉스 페리스] 12세 관람가 로맨스/멜로 미국 107 2009 {"1":246,"2":1604,"3":535,"4":4844,"5":3179,"6... NaN
14 군도:민란의 시대 3.5 3.14855 NaN 102,482 7,671 7,200 윤종빈 [하정우, 강동원, 이경영] 15세 관람가 액션 한국 137 2014 {"1":1196,"2":1647,"3":2669,"4":7522,"5":12924... NaN
15 씬 시티 3.5 3.56793 NaN 101,752 8,883 1,061 프랭크 밀러 [브루스 윌리스, 미키 루크, 제시카 알바] 청소년 관람불가 범죄 미국 123 2005 {"1":558,"2":3799,"3":782,"4":8100,"5":2620,"6... NaN
16 끝까지 간다 4.0 3.86662 3.5 116,851 6,526 6,115 김성훈 [이선균, 조진웅, 신동미] 15세 관람가 범죄 한국 111 2013 {"1":201,"2":353,"3":472,"4":1644,"5":2972,"6"... 두 주인공이 처음 직접 대면하게 될 때의 굉장한 박력.
17 빅 히어로 4.0 3.95044 NaN 119,876 10,304 5,545 크리스 윌리엄스 [라이언 포터, 스콧 애짓, 제이미 정] 전체 관람가 애니메이션 미국 108 2014 {"1":403,"2":543,"3":544,"4":1960,"5":3478,"6"... NaN
18 루시 3.0 3.10815 NaN 122,449 9,728 6,180 뤽 베송 [스칼렛 요한슨, 모건 프리먼, 최민식] 청소년 관람불가 액션 미국, 프랑스 90 2014 {"1":2579,"2":3428,"3":4574,"4":12048,"5":1583... NaN
19 버킷 리스트 - 죽기 전에 꼭 하고 싶은 것들 3.5 3.94196 NaN 127,387 40,384 1,187 롭 라이너 [잭 니콜슨, 모건 프리먼, 숀 헤이즈] 12세 관람가 드라마 미국 96 2007 {"1":254,"2":1390,"3":390,"4":3414,"5":2259,"6... NaN
20 킬러들의 수다 3.5 3.36549 NaN 132,497 5,907 598 장진 [신현준, 정재영, 신하균] 15세 관람가 코미디 한국 120 2001 {"1":772,"2":4549,"3":1366,"4":12560,"5":5349,... NaN
21 암살 4.0 3.94286 NaN 142,933 5,514 10,405 최동훈 [전지현, 이정재, 하정우] 15세 관람가 액션 한국 140 2015 {"1":179,"2":323,"3":434,"4":1445,"5":3557,"6"... NaN
22 베테랑 3.5 4.00765 3.5 156,282 5,621 12,327 류승완 [황정민, 유아인, 유해진] 15세 관람가 액션 한국 124 2015 {"1":236,"2":319,"3":414,"4":1417,"5":2903,"6"... 심플하고 힘있게 치고 달리는 영화가 선사하는 통쾌함.
23 메이즈 러너 2.5 3.69728 NaN 159,950 6,841 5,961 웨스 볼 [딜런 오브라이언, 토마스 생스터, 윌 폴터] 12세 관람가 액션 미국 113 2014 {"1":617,"2":1039,"3":1414,"4":4641,"5":8592,"... NaN
24 디 워 0.5 1.98421 NaN 267,408 484 2,215 심형래 [제이슨 베어, 아만다 브룩스, 크레이그 로빈슨] 12세 관람가 판타지 한국 90 2007 {"1":35355,"2":65926,"3":14910,"4":56686,"5":1... NaN
25 건축학개론 3.0 3.58254 NaN 636,441 6,750 3,231 이용주 [엄태웅, 한가인, 이제훈] 12세 관람가 로맨스/멜로 한국 118 2012 {"1":3472,"2":14338,"3":5626,"4":43984,"5":217... NaN
26 어거스트 러쉬 3.5 3.94234 NaN 450,272 13,246 1,565 커스틴 쉐리단 [프레디 하이모어, 조나단 리스 마이어스, 케리 러셀] 전체 관람가 드라마 미국 113 2007 {"1":1275,"2":5987,"3":1918,"4":16750,"5":8455... NaN
27 브루스 올마이티 3.5 3.79117 NaN 314,274 9,659 1,323 톰 새디악 [짐 캐리, 모건 프리먼, 제니퍼 애니스턴] 12세 관람가 코미디 미국 100 2003 {"1":620,"2":3393,"3":1089,"4":10671,"5":6469,... NaN
28 색, 계 4.0 3.55195 NaN 178,290 9,805 1,245 이안 [양조위, 탕웨이, 왕리홍] 청소년 관람불가 로맨스/멜로 미국, 중국, 대만, 홍콩 157 2007 {"1":978,"2":5044,"3":1517,"4":13926,"5":5093,... NaN
29 펄프 픽션 3.5 3.93998 NaN 65,199 17,580 1,466 쿠엔틴 타란티노 [존 트라볼타, 사무엘 L. 잭슨, 우마 서먼] 청소년 관람불가 범죄 미국 154 1994 {"1":113,"2":1300,"3":158,"4":2506,"5":720,"6"... NaN
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
514 광해, 왕이 된 남자 4.0 4.02419 NaN 740,618 8,495 2,878 추창민 [이병헌, 류승룡, 한효주] 15세 관람가 드라마 한국 131 2012 {"1":1780,"2":6653,"3":2773,"4":19218,"5":1370... NaN
515 7번방의 선물 4.0 3.97763 NaN 718,646 6,212 3,769 이환경 [류승룡, 갈소원, 박신혜] 15세 관람가 코미디 한국 127 2012 {"1":7418,"2":16716,"3":6659,"4":32781,"5":182... NaN
516 도둑들 4.0 3.76309 NaN 710,614 4,949 2,893 최동훈 [김윤석, 김혜수, 이정재] 15세 관람가 액션 한국 135 2012 {"1":2414,"2":8829,"3":4207,"4":31241,"5":2036... NaN
517 말죽거리 잔혹사 3.0 3.37415 NaN 284,807 2,659 1,122 유하 [권상우, 이정진, 한가인] 15세 관람가 액션 한국 116 2004 {"1":1829,"2":7344,"3":3355,"4":25527,"5":1288... NaN
518 포화 속으로 3.0 3.30031 1.5 295,020 1,733 872 이재한 [차승원, 권상우, 김승우] 12세 관람가 전쟁 한국 120 2010 {"1":2911,"2":11753,"3":4867,"4":31202,"5":149... 갓 제대한 학도병들이 만든 영화 같다.
519 스파이더맨 2 3.0 3.67278 NaN 331,860 2,607 920 샘 레이미 [토비 맥과이어, 커스틴 던스트, J.K. 시몬스] 12세 관람가 판타지 미국 126 2004 {"1":830,"2":4077,"3":1776,"4":17108,"5":8713,... NaN
520 센과 치히로의 행방불명 5.0 4.27281 NaN 647,024 7,048 3,539 미야자키 하야오 [최덕희, 김영선, 성선녀] 전체 관람가 애니메이션 일본 126 2001 {"1":866,"2":3894,"3":1078,"4":9284,"5":4560,"... NaN
521 나비 효과 5.0 4.04594 NaN 298,343 22,950 1,720 에릭 브레스 [애쉬튼 커쳐, 에이미 스마트, 에릭 스톨츠] 청소년 관람불가 스릴러 미국 113 2004 {"1":664,"2":3439,"3":792,"4":8155,"5":3622,"6... NaN
522 셔터 아일랜드 4.0 3.80457 NaN 219,885 18,106 2,104 마틴 스콜세지 [레오나르도 디카프리오, 마크 러팔로, 벤 킹슬리] 15세 관람가 스릴러 미국 138 2010 {"1":599,"2":4282,"3":829,"4":10539,"5":3894,"... NaN
523 트루먼 쇼 5.0 4.22021 NaN 428,668 22,765 3,243 피터 위어 [짐 캐리, 로라 린니, 노아 엠머리히] 15세 관람가 드라마 미국 102 1998 {"1":695,"2":3046,"3":708,"4":6914,"5":3291,"6... NaN
524 이프 온리 3.0 4.03853 NaN 366,089 21,471 1,733 길 정거 [제니퍼 러브 휴이트, 폴 니콜스, 루시 대번포트] 15세 관람가 로맨스/멜로 미국, 영국 96 2004 {"1":906,"2":4836,"3":1305,"4":12228,"5":5549,... NaN
525 공동경비구역 JSA 5.0 3.89998 NaN 321,863 13,833 1,301 박찬욱 [오동진, 은미, 원호섭] 15세 관람가 드라마 한국 110 2000 {"1":694,"2":3390,"3":900,"4":9629,"5":4234,"6... NaN
526 본 슈프리머시 4.0 4.14620 NaN 233,050 11,009 1,049 폴 그린그래스 [맷 데이먼, 프랑카 포텐테, 브라이언 콕스] 15세 관람가 액션 미국, 독일 110 2004 {"1":415,"2":2088,"3":428,"4":4293,"5":2035,"6... NaN
527 초능력자 2.0 2.85195 NaN 272,508 2,429 1,194 김민석 [강동원, 고수, 정은채] 15세 관람가 스릴러 한국 114 2010 {"1":5817,"2":21666,"3":8388,"4":49212,"5":211... NaN
528 블라인드 2.0 3.40819 3.0 284,610 3,631 785 안상훈 [김하늘, 유승호, 조희봉] 청소년 관람불가 스릴러 한국 111 2011 {"1":1550,"2":8508,"3":2868,"4":26329,"5":1124... 캐릭터의 약점을 영화의 장점으로 바꾸는 솜씨.
529 스쿨 오브 락 3.0 3.79351 3.5 297,396 10,288 1,430 리처드 링클레이터 [잭 블랙, 조앤 쿠삭, 사라 실버맨] 전체 관람가 코미디 미국, 독일 108 2003 {"1":840,"2":4372,"3":1236,"4":12211,"5":5781,... 한바탕의 신나는 난장을 만들어내는 유희정신.
530 500일의 썸머 5.0 3.87432 4.5 290,351 30,515 4,145 마크 웹 [조셉 고든-레빗, 주이 디샤넬, 클락 그레그] 15세 관람가 로맨틱 코미디 미국 95 2009 {"1":881,"2":5666,"3":1279,"4":12680,"5":5313,... 사랑은 꼭 그 사람일 필요가 없는 우연을 반드시 그 사람이어야만 하는 운명으로 바꾸...
531 쇼생크 탈출 4.0 4.42741 NaN 458,522 26,688 3,182 프랭크 다라본트 [팀 로빈스, 모건 프리먼, 밥 건톤] 15세 관람가 드라마 미국 142 1994 {"1":749,"2":3589,"3":601,"4":5289,"5":2135,"6... NaN
532 러브 레터 5.0 3.97103 4.5 226,169 20,212 2,464 이와이 슌지 [나카야마 미호, 토요카와 에츠시, 카시와바라 타카시] 전체 관람가 로맨스/멜로 일본 117 1995 {"1":560,"2":4162,"3":737,"4":8782,"5":2818,"6... 눈의 잔상과 편지의 이명, 끝내 남아 있는 사랑의 흔적들.
533 범죄와의 전쟁 : 나쁜놈들 전성시대 4.0 3.99282 NaN 464,647 15,638 2,243 윤종빈 [최민식, 하정우, 조진웅] 청소년 관람불가 범죄 한국 133 2011 {"1":1008,"2":5099,"3":1419,"4":13383,"5":6578... NaN
534 악마는 프라다를 입는다 4.0 3.83566 NaN 485,522 12,069 2,109 데이빗 프랭클 [앤 해서웨이, 메릴 스트립, 스탠리 투치] 12세 관람가 로맨틱 코미디 미국 109 2006 {"1":939,"2":4630,"3":1584,"4":16019,"5":9278,... NaN
535 이끼 3.0 3.28881 3.5 274,059 5,396 967 강우석 [정재영, 박해일, 유해진] 청소년 관람불가 스릴러 한국 163 2010 {"1":1916,"2":9614,"3":3245,"4":30131,"5":1282... 158분을 달리고도 소진되지 않는 에너지.
536 리얼 스틸 1.0 3.69244 NaN 315,856 5,589 1,423 숀 레비 [휴 잭맨, 에반젤린 릴리, 다코타 고요] 12세 관람가 SF 미국 127 2011 {"1":1088,"2":5026,"3":1966,"4":17349,"5":9465... NaN
537 레옹 4.0 4.29233 NaN 384,705 31,362 4,414 뤽 베송 [장 르노, 나탈리 포트만, 게리 올드만] 청소년 관람불가 범죄 프랑스, 미국 133 1994 {"1":533,"2":2792,"3":614,"4":5691,"5":2673,"6... NaN
538 내가 살인범이다 2.0 3.53845 NaN 309,470 8,553 1,353 정병길 [정재영, 박시후, 정해균] 청소년 관람불가 스릴러 한국 119 2012 {"1":2153,"2":8194,"3":3498,"4":22331,"5":1258... NaN
539 말아톤 4.0 3.60102 NaN 375,039 2,092 799 정윤철 [조승우, 김미숙, 안내상] 전체 관람가 드라마 한국 115 2005 {"1":1174,"2":5835,"3":2050,"4":20412,"5":1001... NaN
540 클래식 5.0 3.85321 NaN 314,513 15,380 1,829 곽재용 [손예진, 조승우, 조인성] 12세 관람가 로맨스/멜로 한국 132 2003 {"1":970,"2":5735,"3":1401,"4":13933,"5":5904,... NaN
541 아이언맨 3 4.0 4.10486 NaN 564,090 7,039 2,794 세인 블랙 [로버트 다우니 주니어, 기네스 팰트로우, 가이 피어스] 12세 관람가 SF 미국, 중국 129 2013 {"1":1198,"2":4521,"3":1666,"4":12696,"5":8740... NaN
542 어린 신부 3.0 2.97457 NaN 341,757 782 757 김호준 [김래원, 문근영, 김인문] 12세 관람가 로맨틱 코미디 한국 115 2004 {"1":4791,"2":21333,"3":7747,"4":54695,"5":219... NaN
543 내 아내의 모든 것 4.0 3.65453 NaN 461,916 8,540 1,931 민규동 [임수정, 이선균, 류승룡] 15세 관람가 로맨틱 코미디 한국 121 2012 {"1":1717,"2":7827,"3":3095,"4":25019,"5":1403... NaN

544 rows × 16 columns


In [2]:
# String => Dictionary 변환
import ast

df1 = pd.DataFrame(index=range(10))

for index, row in df.iterrows():
    dist_dict = ast.literal_eval(row.get('별점분포'))   
    df2 = pd.DataFrame(dist_dict.values())
    df1 = pd.concat([df1, df2], axis=1)

In [3]:
df1


Out[3]:
0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
0 2108 2459 14948 2340 4299 1740 7786 9484 6491 4377 ... 97248 24389 56940 162324 46520 47757 78410 197303 19789 71984
1 7 1312 228 3615 787 6464 627 68 294 268 ... 939 1916 1088 533 2153 1174 970 1198 4791 1717
2 10 2238 316 4063 1612 7653 994 215 764 495 ... 1584 3245 1966 614 3498 2050 1401 1666 7747 3095
3 14 2150 956 5424 1329 7810 895 134 475 398 ... 4630 9614 5026 2792 8194 5835 5735 4521 21333 7827
4 83 6749 1513 8133 6635 9750 5484 2333 5541 4124 ... 9278 12825 9465 2673 12583 10014 5904 8740 21986 14038
5 50 6597 2367 11525 5251 15110 3262 892 2612 1916 ... 16019 30131 17349 5691 22331 20412 13933 12696 54695 25019
6 1472 9397 7526 6501 13675 5136 16857 16408 19241 23240 ... 51499 27166 33556 19824 32122 44313 25697 46867 26642 51010
7 454 16842 9953 17566 15493 13452 15539 8537 13621 14162 ... 97439 85827 71885 33805 74889 100190 60021 73291 116168 107155
8 4509 1367 7289 765 4620 717 5451 13171 8633 7177 ... 26902 6469 14244 41942 11681 15177 18274 37416 3589 18351
9 4318 9011 21200 7099 14473 3879 17810 23202 20943 23118 ... 179984 72477 104337 114507 95499 128117 104168 180392 65017 161720

10 rows × 544 columns


In [4]:
df2


Out[4]:
0
0 71984
1 1717
2 3095
3 7827
4 14038
5 25019
6 51010
7 107155
8 18351
9 161720

In [5]:
df2 = df1.transpose()

df3 = pd.concat([df2.ix[:,1:], df2.ix[:,:0]], axis=1)

df3


Out[5]:
1 2 3 4 5 6 7 8 9 0
0 7 10 14 83 50 1472 454 4509 4318 2108
0 1312 2238 2150 6749 6597 9397 16842 1367 9011 2459
0 228 316 956 1513 2367 7526 9953 7289 21200 14948
0 3615 4063 5424 8133 11525 6501 17566 765 7099 2340
0 787 1612 1329 6635 5251 13675 15493 4620 14473 4299
0 6464 7653 7810 9750 15110 5136 13452 717 3879 1740
0 627 994 895 5484 3262 16857 15539 5451 17810 7786
0 68 215 134 2333 892 16408 8537 13171 23202 9484
0 294 764 475 5541 2612 19241 13621 8633 20943 6491
0 268 495 398 4124 1916 23240 14162 7177 23118 4377
0 159 280 244 2816 1133 17798 9406 13980 26694 8572
0 833 1109 3363 3894 8095 9721 22115 3029 22544 8655
0 69 186 141 1441 691 17710 6399 20209 35774 10711
0 246 535 1604 3179 4844 12990 21657 6560 31673 13669
0 1196 2669 1647 12924 7522 26156 28380 3269 16006 2713
0 558 782 3799 2620 8100 9690 22607 5442 31937 16217
0 201 472 353 2972 1644 26814 12364 17296 42627 12108
0 403 544 543 3478 1960 21940 12859 19271 36988 21890
0 2579 4574 3428 15836 12048 23538 28387 6242 19359 6458
0 254 390 1390 2259 3414 13299 20407 10470 44832 30672
0 772 1366 4549 5349 12560 14382 38527 3664 38626 12702
0 179 434 323 3557 1445 30103 14994 26425 45653 19820
0 236 414 319 2903 1417 31166 12063 31427 52650 23687
0 617 1414 1039 8592 4641 37161 26216 16663 44106 19501
0 35355 14910 65926 16272 56686 8712 46132 1406 14679 7330
0 3472 5626 14338 21799 43984 61959 159911 22984 199358 103010
0 1275 1918 5987 8455 16750 36516 74932 28263 149635 126541
0 620 1089 3393 6469 10671 35734 64547 16868 120436 54447
0 978 1517 5044 5093 13926 18714 43671 9587 53611 26149
0 113 158 1300 720 2506 5159 9866 6283 22912 16182
... ... ... ... ... ... ... ... ... ... ...
0 1780 2773 6653 13707 19218 64363 104992 51875 254822 220435
0 7418 6659 16716 18252 32781 47612 94642 46504 183835 264227
0 2414 4207 8829 20367 31241 76738 148730 34423 243595 140070
0 1829 3355 7344 12887 25527 32512 85617 7965 81038 26733
0 2911 4867 11753 14956 31202 27829 86515 6797 75137 33053
0 830 1776 4077 8713 17108 35702 85251 11654 111257 55492
0 866 1078 3894 4560 9284 34269 59920 57238 207706 268209
0 664 792 3439 3622 8155 21522 40860 24174 105567 89548
0 599 829 4282 3894 10539 20787 40458 17404 77939 43154
0 695 708 3046 3291 6914 25142 41245 46248 144162 157217
0 906 1305 4836 5549 12228 25338 53239 24528 116785 121375
0 694 900 3390 4234 9629 27473 55591 21992 131500 66460
0 415 428 2088 2035 4293 15706 27495 16559 82502 81529
0 5817 8388 21666 21128 49212 21120 83282 3237 42724 15934
0 1550 2868 8508 11249 26329 26360 84131 7054 83611 32950
0 840 1236 4372 5781 12211 30984 58886 15726 110000 57360
0 881 1279 5666 5313 12680 27087 47612 23477 96953 69403
0 749 601 3589 2135 5289 15286 28854 43314 119334 239371
0 560 737 4162 2818 8782 15123 36934 15101 73481 68471
0 1008 1419 5099 6578 13383 37959 69027 31844 170676 127654
0 939 1584 4630 9278 16019 51499 97439 26902 179984 97248
0 1916 3245 9614 12825 30131 27166 85827 6469 72477 24389
0 1088 1966 5026 9465 17349 33556 71885 14244 104337 56940
0 533 614 2792 2673 5691 19824 33805 41942 114507 162324
0 2153 3498 8194 12583 22331 32122 74889 11681 95499 46520
0 1174 2050 5835 10014 20412 44313 100190 15177 128117 47757
0 970 1401 5735 5904 13933 25697 60021 18274 104168 78410
0 1198 1666 4521 8740 12696 46867 73291 37416 180392 197303
0 4791 7747 21333 21986 54695 26642 116168 3589 65017 19789
0 1717 3095 7827 14038 25019 51010 107155 18351 161720 71984

544 rows × 10 columns


In [6]:
df4 = df3.rename(columns={
         1:"0.5", 2:"1", 3:"1.5", 4:"2", 5:"2.5", 6:"3", 7:"3.5", 8:"4", 9:"4.5", 0:"5"
    })
df4


Out[6]:
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0 7 10 14 83 50 1472 454 4509 4318 2108
0 1312 2238 2150 6749 6597 9397 16842 1367 9011 2459
0 228 316 956 1513 2367 7526 9953 7289 21200 14948
0 3615 4063 5424 8133 11525 6501 17566 765 7099 2340
0 787 1612 1329 6635 5251 13675 15493 4620 14473 4299
0 6464 7653 7810 9750 15110 5136 13452 717 3879 1740
0 627 994 895 5484 3262 16857 15539 5451 17810 7786
0 68 215 134 2333 892 16408 8537 13171 23202 9484
0 294 764 475 5541 2612 19241 13621 8633 20943 6491
0 268 495 398 4124 1916 23240 14162 7177 23118 4377
0 159 280 244 2816 1133 17798 9406 13980 26694 8572
0 833 1109 3363 3894 8095 9721 22115 3029 22544 8655
0 69 186 141 1441 691 17710 6399 20209 35774 10711
0 246 535 1604 3179 4844 12990 21657 6560 31673 13669
0 1196 2669 1647 12924 7522 26156 28380 3269 16006 2713
0 558 782 3799 2620 8100 9690 22607 5442 31937 16217
0 201 472 353 2972 1644 26814 12364 17296 42627 12108
0 403 544 543 3478 1960 21940 12859 19271 36988 21890
0 2579 4574 3428 15836 12048 23538 28387 6242 19359 6458
0 254 390 1390 2259 3414 13299 20407 10470 44832 30672
0 772 1366 4549 5349 12560 14382 38527 3664 38626 12702
0 179 434 323 3557 1445 30103 14994 26425 45653 19820
0 236 414 319 2903 1417 31166 12063 31427 52650 23687
0 617 1414 1039 8592 4641 37161 26216 16663 44106 19501
0 35355 14910 65926 16272 56686 8712 46132 1406 14679 7330
0 3472 5626 14338 21799 43984 61959 159911 22984 199358 103010
0 1275 1918 5987 8455 16750 36516 74932 28263 149635 126541
0 620 1089 3393 6469 10671 35734 64547 16868 120436 54447
0 978 1517 5044 5093 13926 18714 43671 9587 53611 26149
0 113 158 1300 720 2506 5159 9866 6283 22912 16182
... ... ... ... ... ... ... ... ... ... ...
0 1780 2773 6653 13707 19218 64363 104992 51875 254822 220435
0 7418 6659 16716 18252 32781 47612 94642 46504 183835 264227
0 2414 4207 8829 20367 31241 76738 148730 34423 243595 140070
0 1829 3355 7344 12887 25527 32512 85617 7965 81038 26733
0 2911 4867 11753 14956 31202 27829 86515 6797 75137 33053
0 830 1776 4077 8713 17108 35702 85251 11654 111257 55492
0 866 1078 3894 4560 9284 34269 59920 57238 207706 268209
0 664 792 3439 3622 8155 21522 40860 24174 105567 89548
0 599 829 4282 3894 10539 20787 40458 17404 77939 43154
0 695 708 3046 3291 6914 25142 41245 46248 144162 157217
0 906 1305 4836 5549 12228 25338 53239 24528 116785 121375
0 694 900 3390 4234 9629 27473 55591 21992 131500 66460
0 415 428 2088 2035 4293 15706 27495 16559 82502 81529
0 5817 8388 21666 21128 49212 21120 83282 3237 42724 15934
0 1550 2868 8508 11249 26329 26360 84131 7054 83611 32950
0 840 1236 4372 5781 12211 30984 58886 15726 110000 57360
0 881 1279 5666 5313 12680 27087 47612 23477 96953 69403
0 749 601 3589 2135 5289 15286 28854 43314 119334 239371
0 560 737 4162 2818 8782 15123 36934 15101 73481 68471
0 1008 1419 5099 6578 13383 37959 69027 31844 170676 127654
0 939 1584 4630 9278 16019 51499 97439 26902 179984 97248
0 1916 3245 9614 12825 30131 27166 85827 6469 72477 24389
0 1088 1966 5026 9465 17349 33556 71885 14244 104337 56940
0 533 614 2792 2673 5691 19824 33805 41942 114507 162324
0 2153 3498 8194 12583 22331 32122 74889 11681 95499 46520
0 1174 2050 5835 10014 20412 44313 100190 15177 128117 47757
0 970 1401 5735 5904 13933 25697 60021 18274 104168 78410
0 1198 1666 4521 8740 12696 46867 73291 37416 180392 197303
0 4791 7747 21333 21986 54695 26642 116168 3589 65017 19789
0 1717 3095 7827 14038 25019 51010 107155 18351 161720 71984

544 rows × 10 columns


In [7]:
dist_df = df4.reset_index().drop("index", 1)
dist_df


Out[7]:
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0 7 10 14 83 50 1472 454 4509 4318 2108
1 1312 2238 2150 6749 6597 9397 16842 1367 9011 2459
2 228 316 956 1513 2367 7526 9953 7289 21200 14948
3 3615 4063 5424 8133 11525 6501 17566 765 7099 2340
4 787 1612 1329 6635 5251 13675 15493 4620 14473 4299
5 6464 7653 7810 9750 15110 5136 13452 717 3879 1740
6 627 994 895 5484 3262 16857 15539 5451 17810 7786
7 68 215 134 2333 892 16408 8537 13171 23202 9484
8 294 764 475 5541 2612 19241 13621 8633 20943 6491
9 268 495 398 4124 1916 23240 14162 7177 23118 4377
10 159 280 244 2816 1133 17798 9406 13980 26694 8572
11 833 1109 3363 3894 8095 9721 22115 3029 22544 8655
12 69 186 141 1441 691 17710 6399 20209 35774 10711
13 246 535 1604 3179 4844 12990 21657 6560 31673 13669
14 1196 2669 1647 12924 7522 26156 28380 3269 16006 2713
15 558 782 3799 2620 8100 9690 22607 5442 31937 16217
16 201 472 353 2972 1644 26814 12364 17296 42627 12108
17 403 544 543 3478 1960 21940 12859 19271 36988 21890
18 2579 4574 3428 15836 12048 23538 28387 6242 19359 6458
19 254 390 1390 2259 3414 13299 20407 10470 44832 30672
20 772 1366 4549 5349 12560 14382 38527 3664 38626 12702
21 179 434 323 3557 1445 30103 14994 26425 45653 19820
22 236 414 319 2903 1417 31166 12063 31427 52650 23687
23 617 1414 1039 8592 4641 37161 26216 16663 44106 19501
24 35355 14910 65926 16272 56686 8712 46132 1406 14679 7330
25 3472 5626 14338 21799 43984 61959 159911 22984 199358 103010
26 1275 1918 5987 8455 16750 36516 74932 28263 149635 126541
27 620 1089 3393 6469 10671 35734 64547 16868 120436 54447
28 978 1517 5044 5093 13926 18714 43671 9587 53611 26149
29 113 158 1300 720 2506 5159 9866 6283 22912 16182
... ... ... ... ... ... ... ... ... ... ...
514 1780 2773 6653 13707 19218 64363 104992 51875 254822 220435
515 7418 6659 16716 18252 32781 47612 94642 46504 183835 264227
516 2414 4207 8829 20367 31241 76738 148730 34423 243595 140070
517 1829 3355 7344 12887 25527 32512 85617 7965 81038 26733
518 2911 4867 11753 14956 31202 27829 86515 6797 75137 33053
519 830 1776 4077 8713 17108 35702 85251 11654 111257 55492
520 866 1078 3894 4560 9284 34269 59920 57238 207706 268209
521 664 792 3439 3622 8155 21522 40860 24174 105567 89548
522 599 829 4282 3894 10539 20787 40458 17404 77939 43154
523 695 708 3046 3291 6914 25142 41245 46248 144162 157217
524 906 1305 4836 5549 12228 25338 53239 24528 116785 121375
525 694 900 3390 4234 9629 27473 55591 21992 131500 66460
526 415 428 2088 2035 4293 15706 27495 16559 82502 81529
527 5817 8388 21666 21128 49212 21120 83282 3237 42724 15934
528 1550 2868 8508 11249 26329 26360 84131 7054 83611 32950
529 840 1236 4372 5781 12211 30984 58886 15726 110000 57360
530 881 1279 5666 5313 12680 27087 47612 23477 96953 69403
531 749 601 3589 2135 5289 15286 28854 43314 119334 239371
532 560 737 4162 2818 8782 15123 36934 15101 73481 68471
533 1008 1419 5099 6578 13383 37959 69027 31844 170676 127654
534 939 1584 4630 9278 16019 51499 97439 26902 179984 97248
535 1916 3245 9614 12825 30131 27166 85827 6469 72477 24389
536 1088 1966 5026 9465 17349 33556 71885 14244 104337 56940
537 533 614 2792 2673 5691 19824 33805 41942 114507 162324
538 2153 3498 8194 12583 22331 32122 74889 11681 95499 46520
539 1174 2050 5835 10014 20412 44313 100190 15177 128117 47757
540 970 1401 5735 5904 13933 25697 60021 18274 104168 78410
541 1198 1666 4521 8740 12696 46867 73291 37416 180392 197303
542 4791 7747 21333 21986 54695 26642 116168 3589 65017 19789
543 1717 3095 7827 14038 25019 51010 107155 18351 161720 71984

544 rows × 10 columns


In [8]:
dist_df.to_csv('../resource/preprocess_dist_df.csv', index=False, encoding='utf8')