분류 전체보기
-
AlphaFold2, Bioinformatics 용어정리Bioinformatics 2023. 1. 29. 09:25
(주의: 바이오비전공자가 정리하는 내용으로 오류가 있을 수 있음. 오류 정정 환영합니다 🙇♀️) CASP(Critical Assessment of techniques for protein Structure Prediction)이라는 세계 단백질 구조 예측 학술대회가 있다. 알파고를 만든 딥마인드가 만든 AlphaFold2라는 단백질 3차 구조 예측 모델이 2020년 CASP14에서 매우 압도적인 결과를 내놓았다. 이미 AlphaFold 모델도 CASP13에서 우수한 결과를 내놓았는데, 이를 뛰어넘은 것이다. 단백질은 구조가 곧 기능을 나타내기에 단백질의 3차원 구조를 규명하는데는 적게는 수개월, 많게는 수년까지 걸린다. 과거엔 3차원 구조를 알아내는데 단백질을 결정화시켜서 X선을 이용하거나, 극저온현미..
-
매번 검색하는 기본 코드 - python versionpython 2023. 1. 17. 15:08
학생때로 돌아가서 코딩 쪼렙이던 시절(지금도 쪼렙인건 안비밀~. pkl : dump파일 만들기 및 불러오기 ] - 애써 힘들게 만든 AI모델 숨길 수 있어요. import joblib # 학습모델저장 model = LinearRegression().fit(X, y) joblib.dump(model, f"model.pkl") # 저장한 모델 불러오기 loaded_model = joblib.load("model.pkl") [ Dictionary to DataFrame ] import pandas as pd data = {'key1' : val1, 'key2': val2} df = pd.DataFrame.from_dict(data, orient='index') # pd.DataFrame(data)는 오류남. ..
-
pyinstaller로 실행프로그램 만들면서 빡쳤던점 정리python 2023. 1. 17. 14:00
pyintaller는 실행프로그램을 만들 수 있는 python 패키지이다. python으로 자동화프로그램을 개발해서 넘길때 실행파일(exe)을 만들어야하는 상황이 종종 있는데, 가장 많이 사용하는 패키지인듯 하다. 어떤 경우에 사용하는지? - 나는 주로 테스트데이터의 ML모델을 붙여서 결과(예측값, 평가지표)를 엑셀파일로 만드는 자동화프로그램을 만드는데, 분명 이전과 동일한 방식으로 만들어도 버전차이 등의 이유로 다른 에러가 뜨는 경우로 인해 개발은 다했는데 이것때문에 야근을 하게되는 빡치는 상황을 다음에도 만나지 않기 위해 정리해두려고 한다. 이런걸로 야근하는게 개같다 이거예요 [기본 명령어] - 설치 pip install pyinstaller - 자동화파일(exe) 생성 pyinstaller --on..
-
sklearn 회귀모델 r2-score 측정ML 2023. 1. 8. 10:03
- 쓸때마다 헷갈리는 모델 성능측정 결정계수(r2) - 회귀분석의 성능 평가 중 하나로, 추정한 선형 모형이 주어진 자료에 적합한 정도를 재는 척도 - 독립변수가 종속변수를 얼마나 잘 설명하는지를 나타냄 - 0~1 사이의 값을 가짐 - SST : (관측값 - 평균)의 제곱합 - SSR : 회귀제곱합, (예측값 - 평균)의 제곱합 -> 갑자기 평균이 나오는 이유: 회귀선이 존재하지 않을 경우 자료를 예측할 때 보통 평균값을 사용하기 때문 - SSE : 잔차제곱합, (관측값 - 예측값)의 제곱합 (SSE와 SSR을 바꿔부르는 경우도 있음) Scikit-learn 회귀모델에서의 결정계수 - 모델의 훈련은 훈련 데이터셋을 사용하지만, 성능 측정은 테스트데이터셋을 사용하여 얼마나 잘 예측할 것인가를 본다. - 공..
-
statsmodels-js - MLR 구현ML 2023. 1. 8. 09:32
- 참고 https://github.com/egusahiroaki/statsmodels-js GitHub - egusahiroaki/statsmodels-js: JavaScript Statistical Libraries JavaScript Statistical Libraries. Contribute to egusahiroaki/statsmodels-js development by creating an account on GitHub. github.com - code import React from 'react'; import './App.css'; function App() { const Stats = require("statsmodels-js"); //예시 data const x = [ [10, 20,..
-
Control Chart 분석Visualization-PowerBI 2023. 1. 1. 09:19
Control chart, SPC chart, 관리도 차트 - 용도 : 제조회사의 품질관리 대시보드에 사용, 공정이 관리 이탈 상태에 있는 시점을 나타내며 특수 원인 변동이 있는지 식별 - 구성 : X축 - 시간순 : Y축 - 중심선(CL), 관리 상한(UCL) 및 관리 하한(LCL), 관리한계 (중심선 ~ 3σ 위와 아래) - 예제데이터: 자전거 판매에 대한 데이터, 주문요청일과 배송일 데이터로 월평균 배송 소요일 관리 - X축 : MonthYear, 텍스트형식, yyyymm - Y축 -- Avg Days to Ship ; Sales 테이블의 배송일-주문요청일 평균값 Avg Days to Ship = AVERAGEX(Sales, [ShipDate] - [OrderDate]) -- Central Line..
-
2023 새해목표2023 2023. 1. 1. 08:38
기록 - 매주 일요일에 Tech 블로그 정리 + 기왕 블로그하는거 올해안에 블로그 수익화! 😁 - 지출내역 주 단위로 정리 - Python & 데이터분석 교재 업데이트(Notion) 건강 - 음식 건강하게 먹기! - 너무 오래 생각만 하지말고 일단 시도해보기 - 챌린저스 앱 활용하여 홈트기록하기 (주 3회이상) Study - AWS 자격증 1개 1/4분기 이내에 취득 - AI & 클라우드 관련 스터디내용 블로그에 정리하기 - Speak 또는 영어 어플 출퇴근시간에 10분 이상 이용 Side project - AI 프로젝트 2개이상 만들어보기(NLP, 영상인식) - kaggle / dacon 2회이상 참여 - Python / React Native 둘 중 하나로 간단 어플 만들어보기 - 웹개발 협업 프로젝..
-
[SQL200제] 001-010DB 2022. 1. 5. 23:21
_002 테이블의 모든 열 출력 테이블의 모든 컬럼 출력 후 맨 끝에 다시 특정 컬럼을 한번 더 출력하는경우 SELECT dept.*, deptno FROM dept; _003 별칭 사용하기 별칭 사용 시 대소문자 구분, 공백 및 특수문자가 들어가는 별칭의 경우 ""로 감싼다. 수식 사용 시 컬럼 별칭을 사용하면 order by 절을 사용할 때 유용하다. SELECT sal as "Salary" FROM dept; SELECT ename, sal * (12 + 3000) as 월급 FROM emp ORDER BY 월급 DESC; _004 연결 연산자; || 실무에선 CONCAT()을 사용한 경험이 있다. 연결 연산자를 이용한 경우 별칭은 맨 마지막에 사용 SELECT ename || '의 직업은 ' ||..