텍스트마이닝에서 파이썬을 사용하기 위해 우선 파이썬의 기본에 대해 설명하겠습니다. 1. 파이썬이란? 1990년 암스테르담의 귀도 반 로섬이 개발한 인터프리터 언어로 구글에서 만들어진 소프트웨어의 많은 비중(50% 이상)이 Python 으로 개발되었다고 합니다. Python으로 개발된 프로그램의 예를 들면 Dango(무료 오픈소스 웹 애플리케이션 프레임워크)가 있습니다. +여기서 인터프리터 방식의 언어에 대해 설명해보자면 프로그램 방식에 따라서 언어를 구분하는 방식에 포함됩니다. 1) 컴파일러 방식 : 전체 코드를 번역해서 한 번에 실행해야 함 (예: C, JAVA) 2) 인터프리터 방식 : 한줄씩 코드를 번역해서 실행 가능 (Python, C++) 파이썬을 배우다보면 한 줄씩 코드를 실행하고 결과를 확인..
오늘은 많은 분들이 관심 있으신 텍스트마이닝에 대해 알아보기 전 간단한 개요로 먼저 시작하려고 합니다. 1. 데이터마이닝 우선 텍스트마이닝의 좀 더 큰 틀인 데이터마이닝에 대해 설명해보겠습니다. 정말 간단하게 말하면 텍스트 데이터에 데이터마이닝 기법을 적용하게 되는 것이 텍스트마이닝이라 할 수 있는데요. 데이터마이닝 분석의 결과는 빅데이터를 형성하고 지배하는 법칙인 모델이 나오는 것입니다. 이러한 모델의 목표는 어떤 데이터에 대한 분류, 예측, 인식과 같은 Predict/Description 으로 구분되는 경우가 많습니다. 데이터마이닝 분석의 이론적 토대에는 머신러닝(Machine Learning) 기계학습이 있습니다. 머신러닝의 종류도 2가지가 있습니다. 1) 감독형 학습(Supervised Learn..
Comment