딥러닝용어:평가 혼동행렬 confusion Matrix 정확도 accuracy 데이터가 불균형할 때 잘못된 지표로 사용될 가능성이 있음 정밀도 precision 재현율 recall 정밀도 precision : 모델이 True라고 예측한 것 중 실제로 True인 비율 → 혼동행렬의 가로축 재현율 recall: 실제 데이터가 True인 것 중에서 모델이 True라고 예측한 비율. 민감도Sensitivity라고도 한다. → 혼동행렬의 세로축 햄버거의 유통기한 경과 여부를 판별하는 기계가 있다고 할 때, 재고 관리 직원*은 정상 햄버거를 유통기한이 지난 햄버거로 판별하여 버리지 않도록 해야 한다. → 정밀도가 높은 기계 사용 제품 판매 직원은 유통기한이 지난 햄버거를 정상 햄버거로 판별하여 고객에게 주지 않도록..
Python
딥러닝 학습 용어 하이퍼파라미터 어떠한 값이 적절한지 모델과 데이터가 알려주지 않기 때문에, 모델 외적인 요소 라고도 한다. 배치와 배치 크기 에폭(epoch)와 스텝(step) 에폭은 전체 데이터를 사용하여 학습하는 횟수. 스텝은 모델이 가진 파라미터(가중치)를 1회 업데이트 하는 것. 지도학습 정답이 포함된 데이터로 학습 비지도학습 정답이 포함되어있지 않은 학습 강화학습 주어진 환경에 대해 보상reward을 통해 학습 과대적합 모델이 학습 데이터에서는 좋은 성능을 보이지만, 새로운 데이터에 대해 좋은 성능을 보이지 못하는 결과 해결방법 학습 데이터를 다양하게, 많이 수집 정규화Regularization 사용 이상치Outlier 제거 ( 데이터가 충분할 경우에는 좋지 않은 방법이다 ) 과소적합 충분한 ..
케라스란 파이썬으로 설계된 머신러닝 라이브러리 머신러닝 프로세스 [문제 정의 및 데이터 준비하기] → [학습하기] → [추론 및 평가] → 1. 문제 정의 및 데이터 준비 데이터의 명확한 정의 데이터 전처리 방법의 선택 2. 학습하기 선택한 모델이 주로 어떤 데이터에 적용이 되었는지? 사례는? 모델이 얼마나 깊어야 하는가? 옵티마이저는? 손실함수는? 실험 환경이 적합한가? 3. 추론 및 평가 결과물에 대한 평가기준 세우기 상황에 맞는 학습모델 선택하기 용어 살펴보기 클래스 불균형 클래스가 불균형하게 분포되어 있는 것. 특이한 경우가 포함된 데이터에서 많이 볼 수 있고, 이러한 문제들을 이상 탐지Anomaly Detaction이라고 한다. 과소 표집과 과대 표집 과소표집UnderSampling : 다른 표..
행렬의 내적 A , B, ... : 2차원 이상의 ndarray x , y* , ... : 1차원의 ndarray import numpy as np > 행렬의 곱셈(dot) by numpy x = np.array([1, 2]) W = np.array([[3, 4], [5, 6]]) print(x.dot(W)) print(W.dot(x)) Result [13 16] [11 17] # 계산을 위해서 행렬 x의 모양이 (1,2)에서 (2,1)으로 자동 변경됨 > np.reshape() A = np.arange(1, 7) print(A) A = np.arange(1, 7).reshape((2,3)) print(A) Result [1 2 3 4 5 6] [[1 2 3] [4 5 6]] > Dot B = np.ar..