반응형
- 1절 클라우드 컴퓨팅 기술의 이해와 활용
- 클라우드의 정의
- 클라우드 컴퓨팅은 복잡하고 번거로운 일들을 더는 지상(PC)에서 처리하지 않고 구름 위(중앙서버)로 올려 보내 필요할 때마다 중앙서버에 연결해 쓴다는 의미.
- 인터넷 메일이 클라우드 컴퓨팅의 가장 기본적인 모델
- 클라우드의 분류
- 서비스 모델에 따른 분류
- IaaS(Infrastructure as a Service: 서비스형 인프라)
- 네트워크를 통해 이용자에게 CPU나 하드웨어 등 컴퓨팅 자원을 제공하는 모델
- 대표적인 서비스
- 아마존의 AWS
- PaaS(Platform as a Service: 서비스형 플랫폼)
- 운영체제, 데이터베이스, 프로그램 개발 도구 등 소프트웨어 개발 환경을 제공하는 모델
- 대표적인 서비스
- Heroku(쉬운 개발, 배포 및 관리 서비스)
- Saas(Software as a Service: 서비스형 소프트웨어)
- 업무에서 사용하는 소프트웨어 기능(고객 관리 프로그램, 문서작성 등)을 인터넷 등의 네트워크를 통해 필요한 만큼 이용할 수 있도록 제공하는 형태.
- 대표적인 서비스
- 어도비
- 한글 오피스
- IaaS(Infrastructure as a Service: 서비스형 인프라)
- 운영 모델에 따른 분류
- 퍼블릭 클라우드
- 아마존, MS, 구글과 같은 사업자가 시스템을 구축하고 인터넷망 등의 네트워크를 통해 ‘불특정 다수의 기업과 개인’에게 서비스를 제공하는 형태
- 프라이빗 클라우드
- 인트라넷과 마찬가지로 특정 회사가 클라우드 관련 기술이 활용된 환경을 직접 구축하여 가상화된 인프라를 소유하는 형태
- 기업의 인사, 회계팀이나 높은 보안성을 필요로 하는 서비스 기업에서 사용.
- 하이브리드 클라우드
- 퍼블릭 클라우드와 프라이빗 클라우드를 묶어 동시에 사용하는 방식.
- 코로나 19 사태로 인해 강도 높은 규제와 급변하는 시장 환경에 맞추기 위해 금융기관에서 주로 이용한다고 함.
- 커뮤니티 클라우드
- 공통의 목적을 가진 기업들이 클라우드 시스템을 형성하여 컴퓨팅 자원 수요에 유연하게 대처하는 형태
- 특히 철저한 보안성을 요구하는 방위산업에서도 커뮤니티 클라우드를 통한 테스트 환경을 구축
- 멀티 클라우드
- 2개 이상의 클라우드 공급자가 제공하는 퍼블릭 클라우드로 하나의 서비스를 운영하는 것을 의미
- 단일 공급자에 종속될 경우 비용 통제와 관리가 어렵고 시스템 장애가 발생 시 서비스에 타격을 입기 때문에 사용.
- 퍼블릭 클라우드
- 서비스 모델에 따른 분류
- 클라우드 기술 개관
- 클라우드 컴퓨팅을 구현하기 위해선 서버 가상화(virtualization) 기술과 분산처리(distributed computing) 기술이 필요하다.
- 가상화 기술
- 가상화 기술을 이용하면 1대의 물리적인 서버 컴퓨터로 여러 대의 서버를 이용하고 있는 것처럼 작동시킬 수 있다.
- 가상머신(VM)이라는 복제된 컴퓨터 환경이 만들어지기 때문
- 가상화의 대상이되는 컴퓨팅 자원
- CPU(프로세서)
- 스토리지
- 메모리
- 네트워크
- 분산처리 기술
- 분산처리 기술과 클라우드 서비스를이용하면 데이터를 여러 서버에 나누어 병렬로 처리할 수 있다.
- 분산처리 기술
- 맵리듀스
- 하둡
- 서버 가상화 기술의 진화, 가상머신과 컨테이너 방식
- 최근 서버 가상화 기술의 두 축은 ‘하이퍼바이저”와 ‘컨테이너’ 기반 가상화.
- 하이퍼바이저 방식
- 물리적인 호스트 시스템이 여러 대의 가상머신을 게스트로 운영할 수 있도록 해주는 소프트웨어
- 각각의 가상 머신들을 관리하기 때문에 ‘가상화 머신 모니터’, ’가상화 머신 매니저’라고도 부른다.
- 하이퍼바이저 이전에는 하나의 서버를 여러 사용자가 공유할 수 있도록 물리적으로 공간을 격리
- 하지만 출현 이후엔 물리 서버 자원을 추상화하고 논리적으로공간을 분할하여 가상머신이라는 독립된 가상 환경의 서버를 이용할 수 있게 됨.
- 위치 및 역할의 차이에 따라 Type 1과 Type 2로 구분
- Type 1
- 호스트의 하드웨어 위에서 바로 구동되며 하이퍼바이저가 다수의 가상머신을 관리
- Type 2보단 성능이 좋지만, 여러 하드웨어 드라이버를 세팅해야 함
- Type 2
- 하드웨어 위에 호스트 운영체제가 있고 그 위에서 하이퍼바이저가 다른 응용 프로그램과 유사한 형태로 동작
- Type 1보다 성능이 떨어지지만, 설치가 용이하고 구성이 편리
- 컨테이너 방식
- 애플리케이션과 앱을 구동하는 환경을 격리한 공간을 의미하여, 기존의 가상머신에 비해 가볍고 빠르게 동작하며 시스템에 대한 요구사항이 적다.
- 프로세스를 격리하여 모듈화된 프로그램 패키지로서 작업을 수행.
- 애플리케이션과 이를 실행하는 라이브러리, 바이너리 등을 하나로 묶어서 배포하기에 오류를 최소화할 수 있다.
- 도커, 컨테이너를 관리하는 오픈소스 플랫폼
- 도커는 오픈소스 기반의 컨테이너 관리 플랫폼이자 현재의 컨테이너 기반 클라우드 컴퓨팅의 표준이다.
- 도커와 같이 컨테이너 기반으로 운영되는 서비스의 경우, 갑작스럽게 수요가 증가해도 더 많은 컴퓨티 자원에 컨테이너 이미지를 배포함으로서 늘어난 워크로드를 분산 실행 가능하다.
- 쿠버네티스, 다중 컨테이너에 대한 효율적인 관리와 클러스터링
- 컨테이너 관리에 사용
- 컨테이너는 기존의 가상머신에 비해 경량화된 방식으로 구동되기에 서버 자원을 보다 효율적으로 사용할 수 있다.
- 다만 컨테이너의 수가 많아지면 관리와 운영상에 어려움이 따르게 된다.
- 따라서 여러 컨테이너의 실행을 관리하고 외부의 요구를 적절히 배분, 조율해주는 역할을 컨테이너 오케스트레이션이라고 하며 쿠버네티스가 해당 역할을 한다.
- 데브옵스와 마이크로서비스 아키텍쳐
- 클라우드 네이티브란
- 처음부터 클라우드 환경에 최적화된 애플리케이션, 서비스 개발 패러다임 등을 의미
- 또한 클라우드 컴퓨팅 모델의 장점을 모두 활용하는 애플리케이션을 개발, 실행하는 접근 방식을 총칭.
- 클라우드 네이티브 기술을 적용한 사례로는 컨테이너, 하이브리드 클라우드, 개발부터 배포 과정을 자동화해주는 데브옵스 등이 있다.
- 디지털 전환에 필요한 클라우드 환경에 맞는 솔루션, 데브옵스
- 데브옵스란
- 소프트웨어 개발과 운영의 합성어로 개발자와 운영자 간의 소통, 협업 및 통합을 강조하는 문화, 방법론, 프로세스, 도구 등을 의미.
- 소프트웨어 제품과 서비스를 이른 시간 안에 개발 및 배포하는 것을 목적.
- 데브옵스의 중심은 CI(지속적인 통합) & CD(지속적인 배포)
- 마이크로서비스 아키텍처(MSA)
- 마이크로서비스 아키텍처란
- 클라우드 네이티브 설계 방법 중 하나로 작은 서비스를 하나씩 개발하고 연결하여 전체 애플리케이션을 만들어나가는 방식.
- 빠른 개발, 테스트, 배포 그리고 유지 보수의 이점이 있다.
- 다양한 프로그래밍 언어와 시스템을 활용하여 각각의 기능별로 나눠진 개발팀이 서로의 간섭을 초소화하고 빠르게 개발하며 효율적으로 유지, 보수할 수 있다.
- 또한 개별적인 개발, 테스트, 배포가 가능하기에 CI & CD에 적합한 구조
- 마이크로서비스 아키텍처란
- 데브옵스란
- 클라우드 네이티브란
- 클라우드 컴퓨팅과 에지 컴퓨팅
- 에지 컴퓨팅과 클라우드 컴퓨팅은 대조되는 개념의 기술
- 에지 컴퓨팅은 과거 클라우드에 맡겼던 데이터 처리 일부를 단말기나 단말기에 가까운 현장의 서버인 말단부인 에지에서 처리하는 구조.
- 클라우드 아래 계층에 해당하기 때문에 ‘포그 컴퓨팅’이라고도 부른다.
- 자율주행차량처럼 실시간 응답 성능이 필요한 경우, 클라우드를 사용하면 발생되는 지연 시간이 생기기에 에지 쪽에서 처리하는 방식
- 클라우드의 정의
- 2절 인공지능 기술의 이해와 활용
- 인공지능의 개념
- 인공지능은 학습, 문제 해결, 패턴 인식 등 인간이 가진 지적 능력을 컴퓨터를 통해 구현하는 기술.
- 인공지능 분류
- 강한 인공지능
- 아직 활발한 연구가 이루어지는 인공지능(울트론)
- 약한 인공지능
- 인간이 미리 심어놓은 프로그램에 기반을 둔 명령만을 수행하고 특정 목적을 위해 개발
- 스팸메일 필터링, 이미지 분류, 기계번역 등
- 강한 인공지능
- 인공지능 vs 머신러닝 vs 딥러닝
- 인공지능이 인간의 지능을 컴퓨터로 구현하는 기술이라면, 머신러닝은 데이터를 활용해 인공지능을 구현하는 구체적인 접근 방식이며, 딥러닝은 합성곱 신경망, 심층 신경망, 순환 신경망 등과 같은 ’인공 신경망’을 이용해 스스로 분석한 후 답을 내는 방식
- 머신러닝
- 약한 인공지능을 구현하는 데 쓰이며, 컴퓨터에 데이터를 주고 패턴을 찾아내게 하는 방법
- 학습 데이터 유무에 따른 분류
- 지도 학습
- 비지도 학습
- 딥러닝
- 인간의 두뇌를 모방한 심층 신경망을 이용하여 최적의 결론을 도출.
- 인간이 데이터를 분류해서 전달해주는 작업이 생략되고 스스로 다양한 데이터를 분류하여 같은 집합들끼리 묶은 뒤, 층을 쌓아 신경망을 구축하며, 층을 지날수록 필터링을 통해 유용한 정보만을 걸러내는 방법.
- 하드웨어 성능이 뛰어나고 활용 데이터가 많은 때 사용하면 좋다.
- 인공지능의 편항성에 대한 도전
- 인공지능에 차별과 편견을 심어 놓는 주체는 인간
- 알고리즘에는 인간의 편견이 투영되어 있기에 오늘날 일상의 모든 분야에서 작동하고 있는 알고리즘들을 자신과는 무관한 전문가들의 영역이라고 내버려둬서는 안 된다고 주장.
- 인공지능이 의사결정의 기반으로 삼는 데이터에는 인간의 사고방식이 담겨 있기에, 결국 인공지능의 문제는 인간의 문제로 귀결된다.
- 설명가능한 인공지능(XAI)
- 인공지능이 도출한 해답에 대한 ‘신뢰성 문제’를 해결하는 데 필요한 것이 사용자가 시스템 내부의 의사결정 과정을 이해할 수 있도록 하는 ’설명가능한 인공지능(eXplainable AI, XAI)’.
- XI는 인공지능의 행위와 판단을 사람이 이해하는 형태로 설명할 수 있는 인공지능을 의미.
- 3세대 인공지능
- 유럽연합에서 GDPR 제 22조에 인공지능 알고리즘에 의해 자동으로 결정된 사안에 대해 회사의 설명을 강제하는 ‘자동화된 의사결정 제한’이라고 명시.
- 해당 법을 근거로 빅데이터나 인공지능을 활용할 떄 지켜야 할 규정이 생성됨.
- 인공지능에 차별과 편견을 심어 놓는 주체는 인간
- 인공지능 도입 영역이 넓어지는 금융권
- 금융업에는 정형 데이터가 많기에 인공지능이 적용될 수 있는 범위가 상당히 포괄적.
- 지금까진 챗봇, 로보어드바이저 등 소비자와의 접점이 한정된 분야에 사용됐지만, 이제는 신용평가 리스크 관리, RPA, 이상거래탐지시스템(FDS), 기계 독해(MRC) 등으로 인공지능 활용 분야가 점차 넓어지고 있다.
- 금융분야 인공지능 가이드라인의 취지 및 핵심 가치
- 금융분야 인공지능 가이드라인
- 3중 내부통제장치
- 데이터 정확성, 안전성 확보
- 금융소비자 권리 보장
- 투명성 공정성 제고
- AI 가이드라인
- 금융산업의 책임성 강조
- AI 학습용 데이터의 정확성, 안정성 확보
- AI 금융서비스의 투명성, 공정성 담보
- 금융소비자 권리의 엄격한 보장
- 금융분야 인공지능 가이드라인
- 국내 사례: 금융분야 AI 서비스 도입 사례
- Front Office: 고객 상담 자동화로 소요 시간이 단축되고 맞춤형 상품 추천 등이 가능해져 고객 편의성 증대
- Middle Office: AI를 활용하여 신용평가, 여신심사, 보험인수 등을 고도화함으로써 비즈니스 모델의 혁신 가능
- Back Office: 금융회사, 핀테크 등이 AI를 활용하여 내부적으로 업무 효율성을 향상시키고 비용 절감
- 인공지능의 개념
- 3절 빅데이터 기술의 이해와 활용
- 빅데이터의 개념
- 정의
- 빅데이터란 디지털 환경에서 생성되는 모든 데이터를 의미.
- 기존 데이터보다 방대하여 기존의 방법이나 도구로 수집, 저장, 분석 등이 어려운 정형 및 비정형 데이터들을 의미.
- 빅데이터의 공통적 속성 3V
- 크기(Volumn)
- 속도(Velocity)
- 다양성(Variety)
- 아직 제대로 정의되지 않은 빅데이터의 개념
- 기존 빅데이터의 속성인 3V에 추가되는 새로운 속성
- 정확성(Veracity)
- 가치(Value)
- 시각화(Visualization)
- 빅데이터를 수직하고 분석, 처리한 후 정보의 사용 대상자가 쉽게 이해할 수 있도록 해야 한다는 것.
- 기존 빅데이터의 속성인 3V에 추가되는 새로운 속성
- 정의
- 빅데이터의 종류(잠재적 가치, 내림차순)
- 비정형 데이터
- 빅데이터의 85% 이상을 차지
- 반정형 데이터
- 정형 데이터와 같이 DB의 고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마 등을 포함하는 데이터.
- HTML 텍스트, XML 등과 같은 인터넷 문서에 포함된 형태의 데이터.
- 정형 데이터
- 비정형 데이터
- 빅데이터의 3대 기술
- 저장 기술
- 대규모 데이터에 필요한 새로운 저장 및 관리 기술인 하둡과 NoSQL이 있다.
- 하둡
- 대용량 데이터를 분산처리할 수 있는 자바 기반의 오픈소스 프레임워크.
- 분산 파일 시스템인 HDFS(Hadoop Distributed File System)에 데이터를 저장하고, 분산 처리 시스템인 맵리듀스(MapReduce)를 이용해 데이터를 처리.
- 오픈소스로 인한 비용 감소와 여러 대의 서버에 데이터를 분산 저장하기에 처리 속도가 빠르다.
- NoSQL
- 기존 관계 데이터베이스의 일관성보다 가용성과 확장성에 초점을 둠.
- Mongo DB, HBase, Cassandra
- 분석 기술
- 기존의 통계학이나 전산학에서 사용하던 데이터 마이닝, 기계 학습, 자연어 처리, 패턴 인식 등을 활용한다.
- 특히 소셜 미디어 등 비정형 데이터의 증가로 분석 기술 중 텍스트 마이닝, 오피니언 마이닝, 소셜 네트워크 분석, 군집 분석 등이 주목 받음.
- 표현 기술
- 특정 기준으로 분석한 데이터의 특징이나 분석 결과를 분석가와 사용자들이 쉽게 이해할 수 있도록 그림이나 그래프 등으로 표현해 주는 기술.
- R, 파이썬
- 저장 기술
- 빅데이터 출현 이전 데이터와 빅데이터 비교
- 빅데이터가 가진 유용성은 클라우드 컴퓨팅의 발전과 확산에 따라 달라질 것으로 예상.
- 빅데이터 처리 과정과 기술
- 데이터 생성
- 수집
- 저장
- 처리
- 데이터 정제 과정
- 분석
- 시각화
- 빅데이터의 개념
- 위 내용을 제외한 핵심정리
- 데이터 3법 개정으로 개인을 식별할 수 없는 정보(비식별 개인정보)를 상업적으로 이용할 버적 근거가 마련 됨.
- 기존에는 금융회사들이 빅데이터의 자문 및 빅데이터 판매 등에 대한 수행 여부가 불명확해 빅데이터 부수업무에 참여하지 못했으나, 이제는 은행, 보험, 금융투자회사, 신용평가사가 빅데이터 부수업무의 수행이 가능
'금융DT' 카테고리의 다른 글
[금융DT] - 디지털 마케팅 (1) (3) | 2024.07.24 |
---|---|
[금융DT] - 디지털금융 기술 (2) (4) | 2024.07.23 |
[금융DT] - 디지털금융 정책 트랜드 (2) (0) | 2024.07.18 |
[금융DT] - 디지털금융 정책 트랜드 (1) (0) | 2024.07.18 |
[금융DT] - 디지털 전환의 이해 (2) (0) | 2024.07.16 |