[Python] 데이터 입,출력
데이터과학/디버깅 2020. 12. 9. 00:05

R 만 주구장창 하다보니 Python 다 까먹어서 다시 시작하려 합니다. txt 데이터 파일의 입,출력 실제 데이터 분석에서는 파이썬 안에서 데이터를 만들어 쓰는 것보다 txt, csv 와 같은 외부형식의 데이터를 많이 사용하기 때문에 입,출력이 매우 중요 - 파일 열기 모드 아주 기본적이지만, 굉장히 중요함 r : 읽기 모드 - 파일을 읽을 때 사용. 이를 사용하면 원본 파일이 수정, 손상이 없음 w : 쓰기 모드 - 파일을 쓸 때 사용. 이를 데이터가 있는 파일에 사용하면 데이터가 초기화되서 전부 날아가는 사태가 발생할 수 있음. - 아직까지는 그런 적이 없어 다행 / 새로운 파일로 작성할 때만 사용! 읽는데는 사용하지 않는다고 보면 되는듯 a : 추가 모드 - 파일의 마지막에 새로운 내용을 추가할 ..

[python] glob 사용법
데이터과학/디버깅 2020. 12. 9. 00:05

glob 는 python 안에 기본으로 내장되어 있는 패키지? x 모듈! 이다. 빅데이터 시대에 데이터가 많은 경우 이 glob 는 데이터 명들을 리스트 형태로 불러와 한 눈에 규칙성을 볼 수 있게 해주는 기능. 디렉토리 (내가 설정한) 안에 같은 확장자로 되어있는 파일을 보여준다. 특정한 문자열이 포함되어 있는 파일만도 추출할 수 있다니 R 에서도 이런 기능이 있었는데 너무 늦게 알았었다. A = glob.glob('원하는 문자열*.확장자')와 같은 형식으로 쓰ㅡ면 된다. 특정한 문자열 포함 파일은 공통된 문자열만 입력한 뒤에 다른 문자열이 나오면 *로 대체해주면 모두 읽히게 된다. 진짜 유용한 기능인듯. - glob 할 때 정렬 안되서 반환되면 다양한 순서로 정렬이 가능하다 filst = sorted..

[R오류해결] Error in scan(file = file, what = what, sep = sep,...)
데이터과학/디버깅 2020. 11. 30. 19:51

데이터파일(csv, xlsx 등)를 불러올 때 빈칸이 있을 경우에 대한 에러 Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, : line 23 did not have 16 elements 와 같은 에러발생시 read.table("파일명.확장자" , sep = "분리자", header = TRUE, ...옵션 , fill = TRUE) 설정 read.csv("파일명.확장자" , sep = "분리자", header = TRUE, ...옵션 , fill = TRUE) fill = TRUE 를 추가로 옵션명에 입력하면 데이터가 없는 공간이 자동으로 처리되면서 오류 해결

[python] 'export'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다.
데이터과학/디버깅 2020. 11. 16. 16:25

제가 공부하고 있는 책의 소스코드는 ipynb 형태인데, 이 주피터 노트북 파일 내에서 외부 코드를 실행하는데 앞에 ! 를 붙여서 많이 사용합니다. 이런식으로 코드 앞에 !를 실행하게 되면 주피터 노트북 안에서도 pip로 패키지 설치 등 가능합니다. 그러나 !export 실행 시 이렇게 'export'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다. 라는 오류가 발생합니다. export 말고도 어떤 코드들에서는 이러한 오류가 발생할 수 있는데, 이는 Path 잡는데 오류가 발생한 것으로 추측됩니다. 정확한 원인과 해결법은 모르겠으나, 우선 급한대로 해결할 수 있는 방법을 알려드리고자 합니다. 윈도우 설정 > 시스템 정보 를 들어가게 되면 이런식으로 왼쪽에 고급 시스템..