1T_데이터 분석을 위한 MongoDB (1) - MongoDB란

  • Mongo DB 설치 안합니다. 이미 설치가 되어 있다. 온라인에 무료로 공개 된 것이 많다.
  • 사용하는 목적은? RDB로 다루는 곳이 훨씬 많을 것이다. 스타트업은 더더욱 RDB를 쓰는 곳이 더 많다. 하지만 초당 데이터가 수십만개씩 쌓이는 곳이 있고 nosql 데이터도 많기 때문에 알고 있어야 한다.
  • SQL을 사용하는 RDB와 noSQL의 차이?
    • noSQL은 종류가 매우 많아. Redis, Hadoop, Spark, MongoDB 등의 종류는 많다.
    • 다 다르기 때문에 복잡하다. noSQL은 MongoDB로 실습. 다른 부분에 적용 되는 것이 많기 때문
  • Mongo DB는 document db라고 불리기도 한다. JSON형태로(key-value). 어느 정도 데이터들의 관계까지도 나타낼 수 있다.
  • 어떤 경우에는 관계형보다 더 편하다고 생각할 수도 있다.
  • table 말고 collection 안에 한 번에 넣는다. JSON형태로. JSON 하나가 row 하나
  • structure
    • Database - Collection(table대신) - Document(low 대신에. column이라는 개념이 없다.)
    • DataFrame으로 뽑으려면 전처리가 필요하다.
  • robomongo 설치

  • mlab에 접속

특정 값들에 대한 인덱싱이 가능하다. 쿼리가 된다. 즉 필터링이 된다.

  • 데이터베이스는 그냥 프로그램이다.
  • MySQL 설치