[Python] H2O 패키지를 활용하여 XGBoost 모델 구축하기
데이터과학/데이터분석 2022. 8. 31. 16:55

최근 프로젝트를 수행하면서 H2O 라는 좋은 패키지를 활용해볼 수 있는 기회가 있어서 이에 대한 내용을 정리해보려고 한다. https://docs.h2o.ai/h2o/latest-stable/h2o-docs/welcome.html Welcome to H2O 3 — H2O 3.36.1.4 documentation Docs » Welcome to H2O 3 Edit on GitHub Welcome to H2O 3 H2O is an open source, in-memory, distributed, fast, and scalable machine learning and predictive analytics platform that allows you to build machine learning models o..

[Windows10] RTX 3090, 3080 GPU tensorflow, pytorch 설치
데이터과학/데이터분석 2020. 12. 21. 20:36

rtx3000번대가 출시된 이후 연이은 물량 부족에 시달리는 중이라고 합니다. 엄청난 성능 증가로 인해 다들 3000번대로 넘어오고 계실텐데요, 저도 이번에 RTX3090 을 얻게 되었습니다. 바쁜 일정에 계속 미루고 미루다 이제서야 GPU 셋팅을 하게 되었는데, 처음 3000번대가 나왔을 때는 tensorflow 와의 호환 문제가 있었다고 들었으나, 이제는 해소되었다고 해서 설치를 하게 되었습니다. 제가 설치한 과정을 자세하게 알려드리겠습니다. 1. 파이썬 아나콘다 설치 아나콘다는 가상환경을 만드는데 가장 많이 사용하는 프로그램으로, 저도 여기서 아나콘다로 가상환경을 만들도록 하겠습니다. 아나콘다 설치법은 제 블로그에도 포스팅 되어있으므로 아래 게시글을 참조해주세요 stat-cbc.tistory.com..

Github 깃허브 Windows10 설치 및 사용법
데이터과학/데이터분석 2020. 12. 9. 00:08

그럼 오늘은 깃허브에 관련된 설명을 시작해보도록 하겠습니다! 1. github란 무엇인가? R을 배우시거나 다른 프로그램을 좀 깊게 배우신 분들은 깃허브라는 이름을 들어보신 적이 있으실 겁니다. 들어보지 않았다? 하시는 분들도 오늘 처음 제가 말했으니 들어보신거죠! 깃허브라는 프로그램은 깃허브는 분산 버전 관리 툴인 깃을 사용하는 프로젝트를 지원하는 웹호스팅 서비스이다. 루비 온 레일스로 작성되었다. GitHub는 영리적인 서비스와 오픈소스를 위한 무상 서비스를 모두 제공한다. 2009년의 Git 사용자 조사에 따르면 GitHub는 가장 인기있는 Git 호스팅 사이트이다. 또한 2011년의 조사에서는 가장 인기있는 오픈 소스 코드 저장소로 꼽혔다. 출처: 위키백과 입니다. 이렇게 핫 한 프로그램? 웹 서..

인지진단모형(Cognitive Diagnostic Model)
데이터과학/데이터분석 2020. 11. 9. 17:02

1. 인지진단모형이란? - 심리학에서 활용되는 심리측정 연구 모형으로 MacReady와 Dayton에 의해 1977년에 DINA라는 모델이 등장하게 되었고, Rupp & Templin에 의해 2008년에 Diagnostic Measurement: Theory, Methods, and Applications 라는 책이 출간되는 등 지속적으로 연구되고 있음. 실제로 국가수준의 많은 시험에서 이러한 인지진단모형을 적용하려는 시도가 계속되고 있음. - 인지진단모형의 기본 개념은 피시험자의 평가 결과를 기반으로 세부적인 인지속성에 대한 숙달/미숙달을 판단하는 정보를 제공하기 위해 개별 피시험자인 학생이 시험에서 보인 문항반응(정답이라 생각해 선택한 보기)을 토대로 해당 피시험자이 각 인지요소 측면에서 어떠한 숙달..