머신러닝&딥러닝

Best Model을 이용해서 잔차 확인 * 잔차 : 실제값과 예측값과의 차이 * 잔차 검정 : 정상성, 정규성 등을 만족하는지 확인하는 검정 * 검정하는 함수 : summary(), plot_dignstics() ○ summary() model.summary() """ SARIMAX Results ============================================================================== Dep. Variable: y No. Observations: 2517 Model: SARIMAX(1, 1, 0) Log Likelihood -4108.843 Date: Tue, 16 Jan 2024 AIC 8221.686 Time: 09:18:25 BIC 8233.34..
사람이미지 증식 및 4차원 독립변수와 종속변수(라벨링) 생성하기 - 사람 사진 10개를 가져와 임의로 위험/안전 인자로 판단하는 종속변수를 지정하여 모델 훈련 후 해당 사진의 증식 이미지(랜덤으로 변화된 이미지) 데이터를 주었을때 종속변수 예측을 잘 하는지 확인 ◇ 특정 폴더 내에 모든 원본 이미지를 읽어들이는 함수 정의 - 특정 원본 이미지 폴더 내에 모든 이미지 파일을 읽어들여서 이미지 픽셀데이터로 변환해서 리턴하는 함수 정의 def load_images(directory): # 각 이미지별 변환 데이터를 저장할 리스트변수 images = [] # 특정 디렉토리의 모든 파일 읽어들이기 for filename in os.listdir(directory): # 특정 확장자를 가지는 파일만 읽어들이기 if..
1. YOLO Camera 객체탐지 ◇ 데이터 읽어들이기 ○ 웹캠 신호 받기 - 어떤 카메라를 사용할지 채널 선택 - 여러개의 카메라가 있으면, 카메라 별로 번호가 부여된다 - 내 PC에 1개만 연결되어있다면, 0번 카메라 번호가 부여된다. #웹캠 신호받기 VidioSignal = cv2.VideoCapture(0) VidioSignal ◇ YOLO 모델 생성하기 YOLO_net = cv2.dnn.readNet('./yolo/config/yolov2-tiny.weights', './yolo/config/yolov2-tiny.cfg') YOLO_net ◇ 라벨링 명칭 데이터 읽어들이기..
- 한 개의 네트워크(계층,모델 같은 의미로 칭함)에서 객체(물체, 사물)을 탐지 - 탐지된 객체의 영역(바운딩박스 - 사각형)과 객체의 이름(사람,고양이,...)을 표시해주는 기능을 수행함 - 객체 탐지 기술이라고해서 'Object Detection'이라고 언어 소통이 된다. - 객체 탐지는 컴퓨터 비전 기술의 세부 분야 중 하나로 주어진 이미지 또는 영상 내에 사용자가 관심있는 객체를 탐지하는 기술을 의미함 - 객체탐지 모델을 만들기에 앞서 바운딩 박스를 만드는 것이 우선시 되어야함 - 바운딩 박스 : 사각형의 시작 좌표(x1,y1) , 종료 좌표(x2,y2)로 표현되는 타겟 위치(객체위치)를 사각형으로 표현한 것을 의미함 - ..
○ 사용 데이터 : Steel Industry Energy Consumption ○ 포함사항 - 전처리(결측, 중복, 이상치 데이터 확인 및 처리(처리할 특성이 있는 경우)) - 상관관계 분석 및 시각화 - 상관관계 검증 - 정규화 및 표준화(Standard, MinMax) 각각 진행 - 머신러닝 분류모델 전체, 다층퍼셉트론에 대한 하이퍼파라메터 튜닝 - 분류 성능평가(평가방법 모두) - 혼동행렬, 혼동행렬도 시각화 - 정규화 및 표준화 별로 각각 가장 우수한 모델 선정 - 최종 가장 우수한 모델 선정 - 사용할 모델 : 머신러닝 분류 모델 전체, 다층퍼셉트론, DNN, 이외 자유롭게 추가 (DNN은 하이퍼파라메터 튜닝 안함) ○ 코드 작성방법 1. 함수 없이 전체 코드 작성 및 실행 2. 기능별로 함수..
- 이미지 분석에 주로 사용되는 대표적 계층 - 기존의 인공신경망에서의 이미지 분석시에는 높이와 너비를 곱한 1차원을 사용하였다면, CNN은 원형 그대로의 높이와 너비 차원을 사용함 - 전체 4차원의 데이터를 사용함 - 기존 이미지 분석 시 높이와 너비를 곱하여 사용하다보면, 원형 그대로의 주변 이미지 공간 정보를 활용하지 못하는 단점이 있으며, 이러한 이유로 특징 추출을 잘 못하여, 학습이 잘 이루어지지 않는 경우가 발생함 - 이러한 기존 인공신경망 모델의 단점을 보완하여 만들어진 모델이 CNN임 - 원형 형태의 이미지 정보를 그대로 유지한 상태로 학습 가능하도록 만들어졌음 - 이미지의 공간정보를 이용하여 특징을 추출함 -..
◇ 라이브러리 정의 # 라이브러리 정의 import tensorflow as tf # 단어사전만들기 from tensorflow.keras.preprosing.text import Tokenizer from tensorflow.keras.preprocessing.sequence import pad_sequences ◇ 규칙기반 데이터 정의하기 ( 질문 / 답변 ) # 규칙기반 데이터 정의하기(질문/답변) questions = [ "전기요금 어때?", "안녕하세요", ... ] answers = [ "전기요금이 계속 인상되고 있어요!", "안녕하세요! 반가워요^^", ... ] len(questions) , len(answers) (49, 49) ▶ 총 49개의 질문과 답변 데이터를 불러들임. 데이터가 많..
- 긴 문장(시퀀스)을 학습하기 어려움 - 시퀀스가 길 수록 초반의 정보는 점진적으로 희석(소멸)됨 즉, 멀리 떨어져있는 단어의 정보를 인식하는데 어려움이 있음 - 이러한 단점을 보완한 모델이 LSTM과 GRU - 단기기억을 오래 기억할 수 있도록 고안된 모델 - 많은 이전 정보를 기억해야 하기 때문에 훈련속도가 느리며, 시스템 저장 공간이 많이 필요함 - LSTM의 느린 속도를 개선하기 위해 고안된 모델 - 성능은 LSTM과 유사함 ** SImple RNN , LSTM , GRU 모두 RMSprop 옵티마이저를 일반적으로 사용함..
- RNN은 텍스트 처리를 위해 고안된 모델(계층) - 바로 이전의 데이터(텍스트)를 재사용하는 신경망 계층임 - 심플 순환신경망(Simple RNN) - 장기기억 순환신경망(LSTM) - 게이트웨이 반복 순환신경망(GRU) ○ 라이브러리 정의 # 사용 라이브러리 import tensorflow as tf from tensorflow import keras tf.keras.utils.set_random_seed(42) tf.config.experimental.enable_op_determinism() ○ 사용할 데이터 셋 - 순환신경망에서 대표적으로 사용되는 데이..
퍼셉트론 : 분류에만 사용 가능 일반적으로 딥러닝에서는 분류를 한다 퍼셉트론 잘 쓰지는 않음 - 인공신경망의 한 종류 - 주로 이진분류 또는 다중분류에 사용되는 초기 인공신경망 모델 - 종속변수가 연속형인 회귀에서는 사용되지 않음(분류에서만 사용) - 퍼셉트론에는 단층 퍼셉트론과 다층 퍼셉트론이 있음 - 주로 다층퍼셉트론이 성능이 좋음 - 입력층과 출력층으로만 구분되어있음 - 주로 이진분류에 사용됨(성능이 낮은경우, 다층 퍼셉트론으로 사용) - 선형 활성화 함수를 사용 < 다층 퍼셉트론(Multi-Layer perceptron, -입력층, 은닉층(하나 이상), 출력층으로 구성됨 - 주로 다중분..
- 입력계층의 출력크기 64 - 은닉계층의 출력크기 32 - 나머지는? - 콜백 함수 모두 적용 - 옵티마이저 모두 적용 후 가장 좋은 성능일때의 옵티마이저 확인해보기 - 정밀도, 재현율, f1-score, confusion_matrix 출력 1. 데이터 불러들이기 import pandas as pd df = pd.read_csv('data/08_wine.csv') df ▶ 이전에 사용하였던 wine 데이터 사용 >> alcohol / sugar / pH / class 2. 독립변수와 종속변수로 나누기 # 독립변수 X와 종속변수 y로 분리하기 X = df.iloc[:,:-1] y = df.iloc[:,-1] X.shape , y.shape ((6497, 3), (6497,)) 3. 정규화 # 정규화 fr..
보호되어 있는 글입니다.
s2h15
'머신러닝&딥러닝' 카테고리의 글 목록