KBSOO

Database Languages

데이터베이스 시스템은 데이터베이스 스키마(database schema)를 지정하기 위한 **Data-Definition Language(DDL)**와 데이터베이스 쿼리(query) 및 업데이트를 표현하기 위한 **Data-Manipulation Language(DML)**를 제공합니다. Data-Definition Language 데이터베이스 스키마(database schema)는 데이터 정의 언어(DDL, Data-Definition Language)라는 특수 언어로 표현된 정의 집합으로 지정됩니다. DDL은 데이터의 추가적인 속성을 지정하는 데에도 사용됩니다. 데이터베이스 시스템에서 사용되는 저장 구조와 접근 방법은 **데이터 저장 및 정의 언어(data storage and definition language)**라는 특수한 DDL 유형의 문장 집합으로 지정됩니다. 이러한 문장은 데이터베이스 스키마의 구현 세부 사항을 정의하며, 이는 일반적으로 사용자에게 숨겨져 있습니다. ...

Levels of Abstraction

Levels of Abstraction 1. Physical Level: 어떤 수준인가? 데이터베이스의 가장 낮은 추상화 단계. 이 단계에서는 데이터가 실제로 어떻게 저장되는지에 초점을 맞춤. 즉 컴퓨터의 하드디스크나 메모리 같은 물리적인 저장 장치에서 데이터가 어떻게 관리되는지를 다룸 주요 특징 데이터가 파일 형태로 어떻게 조직되는지, 어떤 index를 사용하는지, 데이터를 압축하는 방법 등을 결정함 ex) 학생 정보 라는 데이터가 하드디스크의 특정 위치에 파일로 저장되고, 빠른 검색을 위해 index가 설정되어 있다 누가 다룸? Database Administrator(DBA)나 시스템 엔지니어가 다룸. 일반 사용자는 이 복잡한 물리적 세부사항을 알 필요가 없음 ...

Binary Prediction with a Rainfall Dataset

이 글은 Kaggle의 “Binary Prediction with a Rainfall Dataset” 경진대회를 다룹니다. Kaggle 링크: Binary Prediction with a Rainfall Dataset 소스 코드: GitHub Repository 1. 환경 설정 및 데이터 로드 필요한 라이브러리 임포트 1 2 3 4 5 6 7 8 9 10 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split, cross_val_score, GridSearchCV from sklearn.preprocessing import StandardScaler from sklearn.metrics import classification_report, confusion_matrix, accuracy_score, roc_auc_score, roc_curve from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier from sklearn.linear_model import LogisticRegression import xgboost as xgb 데이터 로드 1 2 3 # 훈련 및 테스트 데이터 로드 train_data = pd.read_csv('train.csv') test_data = pd.read_csv('test.csv') 2. 데이터 탐색 (EDA) 기본 정보 확인 1 2 3 4 5 6 7 print("train data:", train_data.shape) # (2190, 13) print("train data info:\n", train_data.info()) print("train data describe:\n", train_data.describe()) print("train data isnull:\n", train_data.isnull().sum()) print("test data isnull:\n", test_data.isnull().sum()) print("train data rainfall value_counts:\n", train_data['rainfall'].value_counts()) print(f"train data rainfall value_counts(normalize):\n{train_data['rainfall'].value_counts(normalize=True)}") 데이터 구조 분석 데이터셋의 정보를 확인하면 다음과 같습니다: ...

WEF - Future of Jobs Report (2)

Jobs outlook Total job growth and loss 응답자들의 일자리 성장 및 감소에 대한 기대치와 국제노동기구(ILO)가 수집한 글로벌 고용 데이터를 결합하여 보면, 2030년까지 새로운 일자리 창출과 대체가 오늘날의 총 정규 일자리의 **22%**에 해당할 것이라고 추정함 거시적 추세로 인해 창출되는 새로운 일자리는 170,000,000자리(총 일자리의 14%) 하지만 현재 일자리 **92,000,000자리(총 일자리의 8%)**가 대체될 것임 -> 2030년까지 **78,000,000자리(총 일자리의 7%)**가 순증가할 것으로 전망 Growing and declining jobs 2030년까지 비율적으로 가장 빠르게 성장하는 직무는 AI 및 로봇 공학의 발전과 디지털 접근성 증가와 같은 기술 발전에 의해 주도되는 경향이 있음 ...

WEF - Future of Jobs Report (1)

Drivers of labour-market transformation 60%의 고용주는 디지털 접근성 확대가 그들의 비즈니스를 변화시킬 것이라고 예상함 이러한 디지털 접근성 확대는 신기술이 노동 시장을 변화시키는 중요한 촉진 요인으로 작용하고 있음 AI 및 정보 처리 기술 86% 로봇과 자율 시스템 58% 에너지 생성 및 저장 기술 41% 앞으로(2025-2030) 이 3가지 기술이 비즈니스에 가장 큰 영향을 미칠 것이라고 고용주들이 예상함 Technological change 2022년 11월 Chat GPT가 출시된 이후 AI에 대한 투자 흐름은 거의 8배 증가함 ...