
시작하기 전
데이터 분야 바이블 책이라고 들어서 읽었습니다. 너무 어려워서 내용 요약은 못하겠다
그리고 책을 읽고 정리하는 글을 쓸 때 마다 드는 생각이 이미 인터넷에 널린게 정리글인데 굳이 내가 적어야 할까 라는 생각이 든다. 백준 플레찍고 자랑하는거랑 비숫한 듯~
후기
트랙잭션, 스키마, 정규화, Kafka 등의 용어를 학습할 수 있었고 이것이 어떤 의미로 사용되는지 알게되었다.
데이터를 어떻게 관리하고, 관리 방법들에 대한 장단점을 알 수 있었다.
확장성, 일관성 신뢰성, 효율성, 유지보수성과 같은 기본적인 사항도 알게되었다.
내용 정리는 엄두가 안나서 단어 정리라도 해야겠다
- 신뢰성 : 시스템이 결함에도 불구하고 올바르게 동작하도록 만드는 것
- 확장성 : 부하 증가에 대응하여 좋은 성능을 유지하기 위한 전략
- 유지보수성 : 시스템을 운영하고 개발하는 팀의 작업 효율성
- 파티셔닝 : 대규모 데이터셋을 작은 단위로 분할하여 분산 저장 및 처리하는 기술 트랜잭션 : 하나 이상의 데이터베니스 연산을 논리적인 하나의 작업 단위로 묶은 것 ACID 속성(원자성 일관성 고립성 지속성)을 보장하려는 목표를 가진다
- 리더와 팔로워 : 복제 시스템에서 쓰기 엿나은 담당하는 노드와 리더의 변경사항을 복제하는 노드로 역할을 나누는 모델
- 스트림 처리 : 데이터가 발생하는 대로 혹은 짧은 시간 간격으로 연속적으로 처리하는 방식 실시간 분석 모니터링 등에 사용
- 데이터 인코딩 : 데이터를 메모리 디스크 네트워크 상에서 표현하는 형식
- LSM 트리 : 쓰기 성능에 최적화된 저장소 엔진 구조입니다. 들어오는 쓰기를 메모리 테이블에 기록하고 가득 차면 디스크에 정렬된 문자열 테이블로 내립니다 이후 백그라운드에서 여러 SSTable을 병합하여 공산 효울성과 읽기 성능을 관리
- B 트리 : 디스크 기반의 균형잡힌 트리 데이터 구조로 대부분의 관계형 데이터베이스에서 기본 인덱스 및 테이블 저장 방식으로 사용됨
마무리
소프트웨어 엔지니어가 되기 위해 읽었는데 왠지 더 멀어진 것 같다.