반응형

2024/12 50

K-means Clustering과 DBSCAN

Ⅰ. K-Means Clustering과 DBSCAN 개념 비교K-MeansDBSCAN- 중심기반 클러스터링 방법으로 n개의 데이터와 k개의 중심점에 대해 데이터와 중심점 간의 거리 최소화하여 그룹화- 밀도기반 클러스터링 방법으로 그룹 수 k를 설정하지 않고 자동적으로 최적의 그룹수를 찾아 그룹화하는 방법 Ⅱ. K-Means Clustering과 DBSCAN 구성 요소와 장단점가. K-Means 와 DBSCAN 구성요소구분 구성 요소설명K-Means그룹 수 K- 초기 설정 값으로 최종 그룹화할 그룹의 수그룹 Cluster- 데이터들을 K개로 그룹화한 그룹중심점 Centroid- 각 그룹의 중심점으로 데이터 나누는 기준DBSCANminPts- 반경 내 최소 개체 수eps(epsilon)- 데이터를 군집화 ..

멀티모달 인공지능

Ⅰ. 인간처럼 사고하는 인공지능, 멀티모달 AI의 개요개념이미지, 텍스트, 음성, 영상 등 다양한 모달리티를 동시에 처리하여 사고하는 AI 모델특징인간 융화- 인간과 AI의 자연스러운 의사소통 수행 가능정보 산출- 다양한 서비스 분야에서의 상황 인식 모델 구성상호작용- 시각, 청각 등 다양한 상호작용으로 사람처럼 사고 Ⅱ. 멀티모달 AI의 종류종류설명Early Fusion- 종류가 다른 두 가지 데이터를 하나의 데이터로 먼저 합친 후 모델 학습- 다양한 데이터 변환 기술 요구, 데이터 전처리 후 융합Late Fusion- 종류가 데이터를 각각 다른 모델에 학습 후 도출된 결과를 융합- 기존의 앙상블 모델의 작동 방식과 유사Joint Fusion- 데이터를 동시에 학습시키지 않고 원하는 모델 깊이에서 병합..

온디바이스 AI

Ⅰ. 디바이스 자체 AI 탑체, 온디바이스 AI의 개념정의- 서버나 클라우드에 연결할 필요 없이 스마트기기 자체적으로 정보 수집 및 연산 처리를 할 수 있는 AI 기술특징- 저지연- 서버 및 클라우드와의 데이터 이동 없이 자체 처리- 향상된 보안- 데이터의 단말 중심 운영으로 이동 중 발생하는 공격 차단- 유연- 서버 및 클라우드 연결이 필요하지 않아 환경에 유연 Ⅱ. 온디바이스 AI의 기술구분기술설명하드웨어HBM(High Bandwidth Memory)- 고성능 컴퓨팅에 필요한 메모리- GPU와 같은 고성능 프로세서에 사용PIM(Processor in Memory)- 데이터 저장하는 메모리 자체 연산 수행- 데이터 전송 속도 향상 및 병목 현상 감소SoC(System on Chip)- 여러가지 기능을 ..

인공지능 윤리 기준(과학기술정보통신부 2020.12.23)

Ⅰ. 인공지능 윤리 기준의 정의- 인간 기준의 인공지능 개발을 목표로 과학기술정보통신부에서 제안한 개발과 활용 과정에서 지켜야할 3대 기본 원칙과 10대 핵심 요건의 윤리 기준 Ⅱ. 인공지능 윤리 기준 3대 기본원칙과 10대 핵심요건가. 3대 기본 원칙기원 원칙설명인간 존엄성 원칙- 인간은 인간을 위해 개발된 기계제품과 교환 불가한 가치- 인간의 생명, 정신적 및 신체적 건강에 해가 되지 않는 개발 및 활용- 인공지능 개발과 활용은 안전성과 견고성을 갖추어 해가 되지 않아야 함사회 공공선 원칙- 공동체로서 사회는 가능한 많은 사람의 행복 가치 추구- 인공지능은 사회 약자와 취약 계층의 접근성 보장- 공익 증진을 위한 인공지능은 사회, 국가 관점에서 보편적 복지 향상기술 합목적성 원칙- 인공지능 기술은 인..

머신러닝 성능지표

Ⅰ. 인공지능 모델의 성능평가, 머신러닝 성능 지표의 정의- 인공지능 모델의 실제 유용성 평가를 위해 데이터 예측 정확도, 분석 시간, 결과 해석 용이성 등의 성능 평가 목적 지표 Ⅱ. 머신러닝 성능지표 상세모델 유형성능 평가 방법설명예측 / 회귀MSEMean Squared Error, 실제값과 예측값의 차이를 제곱 평균한 값RMSERoot Mean Squared Error, MSE에 루트를 씌운 값MAEMean Absolute Error, 실제값과 예측값의 차이를 절댓값으로 평균한 값MAPEMean Absolute Percentage Error, MSE, RMSE의 단점을 보완한 방법분류정확도전체 데이터 중에 정확하게 예측한 데이터의 수정밀도Precision, 양성으로 판단한 것 중, 진짜 양성의 비율..

빅데이터 통합 관리

Ⅰ. 데이터 거버넌스의 개념 및 주요 기능가. 데이터 거버넌스의 개념- 조직의 데이터 관리에 있어 데이터 보안, 개인정보 보호, 정확성, 가용성, 사용성 등을 보장하기 위해 수행하는 관리 프로세스 나. 데이터 거버넌스의 주요 기능기능설명데이터 품질 관리(DQM)- 데이터 프로파일링 및 데이터 정제와 같은 작업을 포함하여 데이터 사용 방법에 따라 실행메타 데이터 관리- 데이터 검색 중 데이터 찾기, 분석 도구에 의한 빅데이터 분석에 사용할 수 있도록 관리데이터 주기 관리- 데이터 생성 및 초기 저장부터 데이터 폐기까지 시스템의 데이터 흐름 관리데이터 보안 및 프라이버시- 데이터 요구 사항 및 정책에 따라 필요한 데이터 보호 수준 정의 및 관리  Ⅱ. 마스터 데이터의 개념과 필요성가. 마스터 데이터의 개념-..

IT 기술/DB 2024.12.04

대용량 데이터베이스의 인덱스

Ⅰ. 검색 연산을 최적화 하기 위한 인덱스의 개요가. 인덱스의 정의정의- 데이터베이스에 저장된 자료를 빠르게 조회하기 위해 테이블에 연관되어 독립적인 저장공간 보유 객체 나. 인덱스의 특징특징설명성능향상- 트랜잭션의 성능향상이 목적- 조회 성능 향상이 주 목적알고리즘- 트리 구조, 해시 함수 등 알고리즘 적용독립성- 테이블에 저장구조와 별도로 인덱스만 저장 가능Trade-Off- 조회와 나머지 성능을 고려하여 인덱스 생성  Ⅱ. 인덱스의 스캔 방식스캔 종류개념도설명인덱스전체 스캔- 인덱스의 모든 데이터 전체를 읽어오는 방법- WHERE인덱스범위 스캔- 인덱스의 일부 데이터의 범위를 지정하여 읽어오는 방법- WHERE, JOIN인덱스고유 스캔- 인덱스의 유일한 값을 검색하는 방법- PRIMARY KEY, ..

IT 기술/DB 2024.12.04

데이터 독립성

Ⅰ. DBMS의 궁극적인 목표, 데이터 독립성의 개요가. 데이터 독립성의 정의- 데이터베이스의 물리적 구조나 데이터의 저장 방식에 변화가 생겨도 응용 프로그램이나 사용자에게 영향을 주지 않는 능력 나. 데이터 독립성의 종류종류설명관련 사상논리적 데이터 독립성- 데이터베이스의 논리적 구조를 변경시키더라도 기존 응용 프로그램에 영향을 주지 않는 것논리적 구조 사상물리적 데이터 독립성- 응용 프로그램이나 데이터베이스의 논리적 구조에 영향을 주지 않고 물리적 구조를 변경시킬 수 있는 것물리적 구조 사상 Ⅱ. 데이터 독립성 보장을 위한 3단계 데이터베이스 구조 및 스키마 설명가. 3단계 데이터베이스 구조의 개념도외부 단계- 사용자가 데이터베이스를 어떻게 보는지를 표현하는 단계개념 단계- DBMS나 관리자가 전체 ..

IT 기술/DB 2024.12.04

분산 데이터베이스의 투명성

Ⅰ. 빅데이터 효율적 관리, 분산 데이터베이스의 정의- 논리적으로는 하나의 시스템에 속하지만 물리적으로 여러개의 사이트에 분산되어 있는 데이터베이스 Ⅱ. 분산 데이터베이스의 투명성투명성개념특징위치 투명성- 사용자나 응용프로그램이 접근할 데이터의 물리적 위치를 알 필요가 없는 성질- Distributed Data Dictionary Directory 활용복제 투명성- 사용자가 응용프로그램이 접근할 데이터가 물리적으로 여러 곳에 복제되어 있는지 여부를 알 필요 없는 성질- 상향식 점진적 확장- 시스템 구현 복잡병행 투명성- 여러 사용자나 응용프로그램이 동시에 분산 데이터베이스에 대한 트랜잭션을 수행하는 경우에도 결과에 이상이 발생하지 않는 성질- Locking- Time Stamp분할 투명성- 사용자가 하나..

IT 기술/DB 2024.12.04

데이터옵스 (DataOps)

Ⅰ. 새로운 데이터 접근 방식, 데이터옵스의 개요가. 데이터 옵스의 개념- 데이터를 분석해 애플리케이션을 형성한 후 최종 사용자에게 신뢰할 수 있는 데이터를 제공하기 위한 데이터 운영 관리 방식 나. 데이터 옵스의 등장배경IT 부서 의존적- 데이터 전담조직에서 IT부서 협조 없이 데이터 확보 및 가공이 어려움권한 부족- 업무의 문제를 찾거나 개선하기 위한 데이터 전담조직의 권한 부족기술환경 부족- 데이터 분석 결과를 업무에 적용하고 결과 분석 후 피드백하기 위한 기술 환경 부족 Ⅱ. 데이터옵스의 프레임워크 및 주요 요소가. 데이터옵스의 프레임워크 나. 데이터옵스의 주요 요소구분주요 요소설명데이터 파이프라인(Data Pipelines)데이터 수집- 데이터 소스, 데이터 아키텍처데이터 엔지니어링- 데이터 셋..

IT 기술/DB 2024.12.04
반응형