2. 파이썬 텍스트마이닝 패키지, NLTK 다운 방법
인공지능/텍스트마이닝 2020. 11. 13. 14:52

지난 시간에는 텍스트마이닝이 뭔지, 데이터마이닝과는 어떤 차이가 있는지에 대해 살펴보았습니다. 파이썬에서 본격적으로 텍스트 데이터를 다루기 위해 필요한 패키지인 NTLK 패키지를 다운받는 방법에 대해서 설명드리도록 하겠습니다. 1. 파이썬 접속 파이썬이 기본적으로 설치되어 있어야 하며, 저는 주피터노트북 에디터에서 실행해보도록 하겠습니다. 파이썬 설치 관련 글 링크 : stat-cbc.tistory.com/6?category=892410 [Day1. 파이썬 설치] 요즘 아주 핫하다 못해 데이터분석=파이썬이라고 생각할 정도로 많이 사용되고 있는 파이썬에 대해서 기초부터 알아보려고 합니다. 당연히 설치부터 분석까지 수행해 볼 예정입니다. 1. 파이썬 stat-cbc.tistory.com 파이썬 아나콘다(주피..

1. 텍스트마이닝 개요
인공지능/텍스트마이닝 2020. 11. 13. 14:35

오늘은 많은 분들이 관심 있으신 텍스트마이닝에 대해 알아보기 전 간단한 개요로 먼저 시작하려고 합니다. 1. 데이터마이닝 우선 텍스트마이닝의 좀 더 큰 틀인 데이터마이닝에 대해 설명해보겠습니다. 정말 간단하게 말하면 텍스트 데이터에 데이터마이닝 기법을 적용하게 되는 것이 텍스트마이닝이라 할 수 있는데요. 데이터마이닝 분석의 결과는 빅데이터를 형성하고 지배하는 법칙인 모델이 나오는 것입니다. 이러한 모델의 목표는 어떤 데이터에 대한 분류, 예측, 인식과 같은 Predict/Description 으로 구분되는 경우가 많습니다. 데이터마이닝 분석의 이론적 토대에는 머신러닝(Machine Learning) 기계학습이 있습니다. 머신러닝의 종류도 2가지가 있습니다. 1) 감독형 학습(Supervised Learn..

[Day4. R Studio 프로젝트 만들기 및 유용한 환경 설정]
데이터과학/R 2020. 11. 11. 17:55

지난 시간까지 기초적인 R을 배우기 위한 프로그램을 설치했으니, 오늘부터는 드디어 프로젝트를 만들어보고 스크립트를 저장해 앞으로 데이터 분석을 위한 환경을 만들어 보겠습니다. 그리고 자신에 맞는 유용한 환경설정을 하는 방법까지 알려드리겠습니다. 1. R Studio 프로젝트 만들기 우선, R studio 로 프로젝트를 만들어보겠습니다. 방법1. 형광펜으로 그어진 곳(Project: None) 버튼을 누르면 새로운 프로젝트를 생성할 수 있습니다. 방법2. 상단바의 File > New Project...을 누르면 생성됩니다. 그 다음으로는 기본적으로 설정되어있는 워킹디렉터리(쉽게말하면 기본 작업공간) 에 저장할지 안할지를 선택할 수 있습니다. 여기서 저장을 하려면 Save를 누르셔야합니다. 여기서 저장을 누..

[Day1. 컴퓨터 비전(Computer Vision) 이란?]
인공지능/Computer Vision 2020. 11. 10. 13:49

요즘 딥러닝이나 데이터사이언스 분야 뿐만 아니라 컴퓨터 과학, 물리학, 수학 등 모든 학문에서 주목하고 있는 컴퓨터 비전에 대해서 알아보도록 하겠습니다. 주로 참고하는 서적은 "Hands-On Computer Vision with TensorFlow2" 이며 추가적으로 참고하는 글은 글 하단에 Reference 를 달아두도록 하겠습니다. 1. 컴퓨터 비전이란? 컴퓨터과학(알고리즘, 데이터 처리, 그래픽), 물리학(광학, 센서), 수학(미적분학, 정보이론), 생물학(시각, 신경) 등 여러 연구 개발 분야가 결합되어 정확한 정의가 어려움 ​ 눈 : 끊임없이 포착하는 시각 자극 판독 > 객체 구분 > 인식 컴퓨터 : RGB값 행렬인 픽셀의 한 덩어리. 그 이상의 의미를 갖지 않음 > 컴퓨터 비전의 목표 : 컴..

[Day3. R Studio 설치]
데이터과학/R 2020. 11. 10. 10:34

저번 시간에 R을 설치함으로써 반은 했으니, 이제 나머지 반의 반을 해봐야겠죠? 오늘은 R studio 을 설치하고 친숙해질 수 있도록 여러 설명을 드려보려 합니다. 댓글이나 쪽지로 언제든 궁금한 점들 질문 해주시면, 답변 드리겠습니다. 1. R studio 설치하기 R studio 다운로드 페이지 : https://www.rstudio.com/products/rstudio/download 에 접속하면 R의 가장 큰 장점인! 무료!!로 설치할 수 있습니다. https://www.rstudio.com/products/rstudio/download2/ 하지만, R studio 에는 추가기능이 존재해 서버기능 등의 고급기능을 이용하려면 유료인데요. 저희가 할 분석은 무료버전에서도 충분히! 충분히 돌아가니 굳이..

[Windows10 파이썬의 여러 스크립트 에디터]
데이터과학/Python 2020. 11. 10. 10:26

안녕하세요! 오늘은 저번에 깔았던 아나콘다와 같은 에디터 프로그램을 알아보겠습니다. 파이썬에는 여러 가지 에디터 프로그램이 있습니다. 그 중에서 가장 유명했던 아나콘다는 지난 시간에 깔아 보았습니다. 아나콘다를 깔게 되면 에디터 프로그램으로 spyder와 jupyter notebook 이라는 프로그램을 사용할 수 있습니다. 1. 별도 프로그램 사용않고 cmd (명령프롬프트)에서 파이썬 사용하기 윈도우에서 cmd (명령프롬프트) 를 접속하시면 이런 화면이 나오게 되는데, 여기에 python 을 입력해주시면 이렇게 설치되어 있는 파이썬 버전이 출력되며 파이썬에서 명령어를 실행할 수 있게 >>> 가 나오게 됩니다. 여기다 원하는 파이썬 명령어를 입력하면 결과가 바로 출력이 됩니다. 가장 간단하고 프로그램 설치..

[Windows10 파이썬 아나콘다 설치]
데이터과학/Python 2020. 11. 9. 20:49

오늘은 파이썬과 함께 가장 많이 사용하는 아나콘다(스파이더)라는 프로그램을 설치해서 파이썬과 함께 실행해보도록 하겠습니다. 이전 시간에 파이썬을 설치해보면서 파이썬을 더 효율적이고 편리하게 사용하기 위해 에디터가 필요하다고 말씀드렸는데 여러 종류의 에디터가 있지만, 가장 많이 쓰고 직관적인 아나콘다라는 프로그램을 사용할 것입니다. 1. 아나콘다(스파이더) 설치 아나콘다를 설치하기 위해서는 https://www.anaconda.com/download/ 에 접속해야 합니다. 그리고 여기 3.6version 의 밑에 다운로드 초록색 버튼을 누르면 설치 파일이 다운로드 됩니다. 꼭 3.6 버전이 아니더라도 3.xx 로 시작하는 최신 버전을 다운로드 받으시면 됩니다. 현재 (2020.11.09) 기준으로 3.8 ..

[파이썬 Windows10 설치]
데이터과학/Python 2020. 11. 9. 20:42

요즘 아주 핫하다 못해 데이터분석=파이썬이라고 생각할 정도로 많이 사용되고 있는 파이썬에 대해서 기초부터 알아보려고 합니다. 당연히 설치부터 분석까지 수행해 볼 예정입니다. 1. 파이썬이란? 파이썬(Python)은 1991년에 귀도 반 로섬이라는 사람이 개발한 대화형 프로그래밍 언어입니다. 사실 파이썬이라는 이름은 귀도가 좋아하는 영국 BBC 방송의 코미디 "Monthy Python's Flying Circus" 의 Python을 따온 거라는거, 알고 계셨나요?! Python이 그리스 신화에 나오는 거대한 뱀, 비단 구렁이라는 뜻도 있는데 이와는 관계가 없다고 하네요! 하지만 파이썬의 로고는 구렁이와 비슷한 모양으로 바뀌어있죠? 2. 파이썬의 특징 1) 범용 프로그래밍 언어 : 최근 파이썬이 핫한 이유는..