Data 2

Databricks vs Snowflake

🔱 요즘 LLM과 AI가 전세계를 휩쓸면서 더불어 이에 대한 원소스가 되는 데이터 시장 역시 증가하고 있습니다. 특히, 퍼블릭 클라우드 기반의 데이터 서비스 시장에 CSP3사(AWS, Azure, GCP)를 제외하고 Snowflake와 Databricks가 핫한 아이템이(?) 되고 있습니다. 본래 각자 추구하는 방향성과 시작포인트를 달랐지만, 영역을 확대하면서 겹치는 분야에서의 경쟁이 이루어지고 있습니다. 마침, 이 두기업에 대한 상세 분석을 해놓은 글이 있어 deepL의 도움을 받아 글을 공유해봅니다(개인적인 의견은 전혀 반영되어 있지 않음을 미리 밝힙니다)~~ ^^ 🍉 데이터브릭스와 스노우플레이크는 클라우드에서 빅데이터 분석 플랫폼의 주요 공급업체로 부상했습니다. 두 라이벌 사이에는 몇 가지 유사점이..

Data 2023.09.07

머신러닝 10가지 알고리즘

머신러닝을 공부하면서 늘 헤깔리는 것중에 하나가 알고리즘 부문인 거 같습니다. 마침, 이 알고리즘을 깔끔하게 정리한 글이 있어 공유해 봅니다. 데이터 영역에 관심있는 분들 뿐만 아니라 머신러닝이나 AI에 관심있는 분들은 원문을 꼭 일독하시길 강추(!)합니다~^^ 📜 지도학습 👉 선형회귀, 로지스틱 회귀, K-최근접 이웃, 나이브 베이즈, 결정 트리, 랜덤 포레스트, XG부스트, 라이트GBM, 📜 비지도학습 👉 K-평균 군집화, 주성분 분석(PCA) 🔔 선형 회귀(Linear Regression) 🚩 문제 유형 : 회귀 🚩 적합한 데이터 유형 : 종속변수와 독립변수가 선형 관계에 있는 데이터 🚩 장점: 모델이 간단하기 때문에 구현과 해석 용이, 짧은 모델링 시간 🚩 단점: 최신 알고리즘에 비해 예측력이 떨..

Data 2023.03.17