keypoint : computation complexity, shifted window Abstract 컴퓨터 비전의 범용 백본 역할을 할 수 있는 새로운 비전 트랜스포머(Swin Transformer)를 소개. NLP에서 vision으로 트랜스포머를 적응(adapting)시키는 문제는 두 domains 간의 차이에서 발생. 예) visual entities의 scale의 visual entities와 텍스트의 단어와 비교하여 이미지의 픽셀 해상도가 높음. 이러한 차이를 해결하기 위해 논문은 representation이 shifted windows으로 계산되는 계층적 트랜스포머를 제안. shifted windowing scheme는 cross-window connection을 허용하는 동시에 self-..
Abstract Self Attention Mechanism 을 기반으로 다양한 상황 의존성을 캡처하여 Scene Segmentation 수행 multi-scale feature fusion 으로 context를 포착하는 이전 논문(ICEnet, ... ) 과 달리, local feature 를 global dependencies과 적응적(adaptively)으로 통합할 수 있는 DANet (Dual Attention Network)을 제안 (position + channel Attention) 두 가지 유형의 Attention 모듈을 dilated FCN 모듈 위에 추가 position 및 channel 에서 각각 semantic interdependencies을 모델링 1) position Atten..
우선, Semantic Segmentation에 대해 알아보기 이전에, Computer Vision의 대표적 Task 2가지인 Object Detection 과 Image Segmentation 의 차이에 대해 알고있어야 합니다. 해당 그림을 보면, Object Detection은 여러 객체(Multiple Objects)를 감싸는 Bounding Box(테두리 박스)를 각각 만드는 Localization을 수행하고, 이 Bounding Box가 가지는 객체(class)가 무엇인지에 대해 Classification 을 수행합니다. 반면 Segmentation은 Bounding Box(테두리 박스)없이 객체의 포토샵 누끼를 따듯 경계선을 정확히 분할합니다. 위의 사진에서는 Instance Segmentat..
'본 포스팅은 모두의연구소(home.modulabs.co.kr) 풀잎스쿨에서 진행된 'semantic-segmenation' 과정 내용을 공유 및 정리한 자료입니다.' 1. introduction Sementic Segmentation 분야에서 가장 유명하다 할 수 있는 논문인 Unet paper(https://arxiv.org/abs/1505.04597) 의 내용 중. 3.1 에서 Data Augmentation 에 관련하여 언급된 부분이 있었습니다. 더보기 We generate smooth deformations using random displacement vectors on a coarse 3 by 3 grid . The displacements are sampled from a Gaussian ..
텍스트마이닝에서 파이썬을 사용하기 위해 우선 파이썬의 기본에 대해 설명하겠습니다. 1. 파이썬이란? 1990년 암스테르담의 귀도 반 로섬이 개발한 인터프리터 언어로 구글에서 만들어진 소프트웨어의 많은 비중(50% 이상)이 Python 으로 개발되었다고 합니다. Python으로 개발된 프로그램의 예를 들면 Dango(무료 오픈소스 웹 애플리케이션 프레임워크)가 있습니다. +여기서 인터프리터 방식의 언어에 대해 설명해보자면 프로그램 방식에 따라서 언어를 구분하는 방식에 포함됩니다. 1) 컴파일러 방식 : 전체 코드를 번역해서 한 번에 실행해야 함 (예: C, JAVA) 2) 인터프리터 방식 : 한줄씩 코드를 번역해서 실행 가능 (Python, C++) 파이썬을 배우다보면 한 줄씩 코드를 실행하고 결과를 확인..
지난 시간에는 텍스트마이닝이 뭔지, 데이터마이닝과는 어떤 차이가 있는지에 대해 살펴보았습니다. 파이썬에서 본격적으로 텍스트 데이터를 다루기 위해 필요한 패키지인 NTLK 패키지를 다운받는 방법에 대해서 설명드리도록 하겠습니다. 1. 파이썬 접속 파이썬이 기본적으로 설치되어 있어야 하며, 저는 주피터노트북 에디터에서 실행해보도록 하겠습니다. 파이썬 설치 관련 글 링크 : stat-cbc.tistory.com/6?category=892410 [Day1. 파이썬 설치] 요즘 아주 핫하다 못해 데이터분석=파이썬이라고 생각할 정도로 많이 사용되고 있는 파이썬에 대해서 기초부터 알아보려고 합니다. 당연히 설치부터 분석까지 수행해 볼 예정입니다. 1. 파이썬 stat-cbc.tistory.com 파이썬 아나콘다(주피..
오늘은 많은 분들이 관심 있으신 텍스트마이닝에 대해 알아보기 전 간단한 개요로 먼저 시작하려고 합니다. 1. 데이터마이닝 우선 텍스트마이닝의 좀 더 큰 틀인 데이터마이닝에 대해 설명해보겠습니다. 정말 간단하게 말하면 텍스트 데이터에 데이터마이닝 기법을 적용하게 되는 것이 텍스트마이닝이라 할 수 있는데요. 데이터마이닝 분석의 결과는 빅데이터를 형성하고 지배하는 법칙인 모델이 나오는 것입니다. 이러한 모델의 목표는 어떤 데이터에 대한 분류, 예측, 인식과 같은 Predict/Description 으로 구분되는 경우가 많습니다. 데이터마이닝 분석의 이론적 토대에는 머신러닝(Machine Learning) 기계학습이 있습니다. 머신러닝의 종류도 2가지가 있습니다. 1) 감독형 학습(Supervised Learn..
요즘 딥러닝이나 데이터사이언스 분야 뿐만 아니라 컴퓨터 과학, 물리학, 수학 등 모든 학문에서 주목하고 있는 컴퓨터 비전에 대해서 알아보도록 하겠습니다. 주로 참고하는 서적은 "Hands-On Computer Vision with TensorFlow2" 이며 추가적으로 참고하는 글은 글 하단에 Reference 를 달아두도록 하겠습니다. 1. 컴퓨터 비전이란? 컴퓨터과학(알고리즘, 데이터 처리, 그래픽), 물리학(광학, 센서), 수학(미적분학, 정보이론), 생물학(시각, 신경) 등 여러 연구 개발 분야가 결합되어 정확한 정의가 어려움 눈 : 끊임없이 포착하는 시각 자극 판독 > 객체 구분 > 인식 컴퓨터 : RGB값 행렬인 픽셀의 한 덩어리. 그 이상의 의미를 갖지 않음 > 컴퓨터 비전의 목표 : 컴..
Comment