분류 전체보기156 [Machine Learning] 특징추출(feature extraction) 선형 변환에 대한 특징추출 특징추출이란? 입력 데이터가 $x_i$로 주어지고 출력 데이터가 $y_i$로 주어질 수도 있다. 주어진 데이터에 대해서 n차원의 랜덤벡터를 통해 변환함수 Φ(파이)를 찾게 된다. 변환함수의 Φ를 찾으면 입력 데이터를 $y_{new}$라는 m차원의 특징벡터로 변환해서 표현된다. 특징추출은 크게 두가지의 목적을 가지고 수행된다. 1) 분류를 하거나 군집 등의 분석을 할 때 불필요한 정보들을 제거하고 핵심적인 정보만 추출하기 위함이다. 2) 원래의 n차원의 데이터를 m차원으로 차원축소해서 계산량을 줄이고 메모리를 감소시켜서 분석 시스템의 효율과 성능을 향상시키기 위함이다. 변환함수(Embedding Function, Transformation Function)란? n차원의 입력값을 .. 2022. 10. 2. [Paper Review] EfficientNetV2 논문 번역 [https://arxiv.org/pdf/2104.00298.pdf](https://arxiv.org/pdf/2104.00298.pdf) Mingxing Tan, Quoc V. Le 세줄요약! Our contributions are threefold: 우리의 기여는 세 가지입니다. - We introduce EfficientNetV2, a new family of smaller and faster models. Found by our training-aware NAS and scaling, EfficientNetV2 outperform previous models in both training speed and parameter efficiency. 더 작고 빠른 모델의 새로운 제품군인 Efficient.. 2022. 9. 22. [Machine Learning] 성능 평가 모델 학습에 들어가기에 앞서 학습시킬 데이터를 먼저 살펴보겠습니다. 머신러닝을 하기 전 먼저 머신러닝 첫 포스팅에서 말씀드린 것과 같이 EDA를 하며 데이터를 파악하는데요 그 과정을 상세히 설명드리겠습니다. 데이터와 데이터 분포 데이터 표현(수치화) 기계는 현실에 있는 언어나 그림을 알아듣지 못하기 때문에 기계가 인식할 수 있도록 수치값으로 변형해서 학습시킬 수 있다. 위와 같은 프로세스를 다른 데이터들에게 적용할 수 있도록 바탕을 n차원의 벡터로 두고 식을 구한다. n차원 공간상의 한 점 x에 대해서 열벡터를 구해보면 다음과 같이 식이 표현된다. 데이터 집합의 분포 수치화된 데이터의 특성을 직관적으로 파악할 수 있도록 분포를 확인한다. 제일 기본적이고 처음에 많이 하는방법은 2차원 데이터 집합의 산점도.. 2022. 9. 7. 수식 & 알파벳 모음 [LaTeX 수식 정리된 사이트] https://en.wikipedia.org/wiki/Help:Displaying_a_formula#Formatting_using_TeX [알파벳 모음] 𝒳 𝑥 : 엑스 그리스 문자 AA αα alpha 알파 BB ββ beta 베타 ΓΓ γγ gamma 감마 ΔΔ δδ delta 델타 EE ϵϵ epsilon 엡실론 ZZ ζζ zeta 제타 HH ηη eta 에타 ΘΘ θθ theta 쎄타 KK κκ kappa 카파 ΛΛ λλ lambda 람다 MM μμ mu 뮤 NN νν nu 누 ΞΞ ξξ xi 크싸이 ΠΠ ππ pi 파이 PP ρρ rho 로 ΣΣ σσ sigma 시그마 TT ττ tau 타우 ΦΦ ϕϕ phi 파이/피 XX χχ chi 카이 ΨΨ ψψ psi 프.. 2022. 8. 23. [Bayes] Bayesian inference(베이즈 추론)의 배경 베이즈 추론이란? (블로그가 지루하다는 친구의 피드백을 받아 물음표 이모티콘 넣어드렸습니다ㅎ헿) 베이즈 추론은 토마스 베이즈와 라플라스가 18세기에 창시한 것으로 통계학의 베이즈 확률론을 기반으로 한 통계적 추론이다. 추론할 대상의 확률 분포를 추정하는 것이 목적이며 확률은 다양한 이벤트와 지식을 바탕으로 주관적인 정도로 해석해 업데이트 한다. 확률 1. 함수 𝑃 ∶ ℬ → [0, 1] 𝓧 : 집합 ℬ : 𝓧의 부분집합들의 모임 𝑃는 𝓧의 부분집합들의 모임에서 0으로 가는 함수다. 아래의 세가지 성질을 만족해야 한다. (i) 𝑃(𝐵) ≥ 0, ∀𝐵 ∈ ℬ; 💡 함수값은 항상 0보다 크거나 같다. (ii) 𝑃(𝓧) = 1; 💡 전체집합에서 확률값은 1이다. (iii) (가산 가법성) ℬ의 부분 집합으로 이.. 2022. 8. 18. [Machine Learning] Decision Tree(의사결정트리) 분류 문제의 사용 분류문제는 고객의 특성에 맞게 쿠폰 선호 여부를 알기 위해 필요하다. 나무 그림을 적용하면 의사를 묻지 않아도 결과를 추측할 수 있다. 의사결정 트리를 만들기 위해서는 엔트로피와 지니계수, 카이제곱스퀘어를 알아야 한다. 엔트로피의 이해 A~F 속성은 고객의 속성을 뜻한다. G 쿠폰반응여부가 머신러닝에서 맞춰야 할 타겟값이다. 이것은 나무그림에서 잎사귀에 해당된다. 타겟값이 있기 때문에 이 문제는 감독학습이며 분류문제에 해당한다. 여기서 직장여부를 Root Node로 잡는다. 엔트로피가 큰 폭으로 줄어드는 방향으로 데이터를 나누어야 한다. 엔트로피란? 무질서한 정도를 나타내는 물리학적 양이다. 자연의 모든 변화는 entropy가 증대되는 방향으로 일어난다. 확률 p란 전체 데이터에서 특정.. 2022. 8. 10. [Machine Learning] 머신러닝 개요 머신러닝이란? 컴퓨터가 주변의 환경에서 발생하는 데이터를 학습하여 유의미한 패턴과 통계적인 함수를 발견하여 앞으로의 행동에 지침이 되는 지식이 얻어내는 행위를 말한다. 기계 학습은 인공 지능의 하위 분야로 광범위하게는 지능적인 인간 행동을 모방하는 기계의 능력으로 정의된다. 인공 지능 시스템은 인간이 문제를 해결하는 방식과 유사한 방식으로 복잡한 작업을 수행하는데 사용된다. 기계 학습은 은행 거래, 사람 사진 또는 빵집 등 과 같이 숫자, 사진 또는 텍스트, 수리 기록, 센서의 시계열 데이터 또는 판매 보고서와 같은 데이터로부터 시작한다. 데이터를 수집해서 훈련 데이터로 사용하거나 기계 학습 모델이 훈련할 수 있도록 정보로 가공한다. 일반적으로 데이터가 많을수록 학습 결과가 더 좋아진다. 머신러닝이 필요.. 2022. 8. 8. [정보처리기사 실기] 수제비 키워드정리 텍스트 https://youtu.be/8QyS3w-wI1I 수제비에서 정리해준 키워드를 한번에 보기 편하게 받아 적었습니다! 이미 외운 것과 외우지 않은 키워드를 분류할 수 있도록 체크박스를 추가했습니다. 모두들 정보처리 기사 실기 한번에 합격하시길 바랍니다 화이팅!! https://docs.google.com/spreadsheets/d/1giAOhJQs63cguA13pY8332rcZhf84zEw1CnXldUWVv0/edit?usp=sharing 정보처리기사 실기 키워드 정리 체크 시트1 소프트웨어 생명주기 모델 종류,폭프나반,폭포수 모델 / 프로토타이핑 모델 / 나선형 모델 / 반복적 모델 나선형 모델 절차,계위개고,계획 및 정의 / 위험분석 / 개발 / 고객 평가 럼바우의 docs.google.com 2022. 5. 6. [Docker] 폐쇄망 Window에서docker ubuntu 개발환경 세팅하기 아직 개발서버도 구축되지 않은 폐쇄망 프로젝트에서 Window 환경의 노트북을 사용하여 로컬로 개발을 진행중이다. 다른 기능들은 윈도우에서 충분히 돌아가는데 bert로 모델 돌리는 테스트는 우분투 환경이 필요해 docker로 개발환경을 구축해보려고 한다. 인터넷이 있는 상황에서는 간단하지만 인터넷이 없는 폐쇄망에 구축하는 것은 조금 더 까다롭다. 설치파일 준비 우선 도커 안에서 직접 다운로드가 어렵기 때문에 설치파일들을 미리 준비해서 장비에 반입해둬야 한다. 설치파일은 아래와 같다 1. docker https://docs.docker.com/desktop/windows/install/#:~:text=Docker%20Desktop%20for%20Windows%20is%20Docker%20designed%2.. 2022. 5. 4. 이전 1 2 3 4 5 ··· 18 다음 728x90 반응형 LIST