분류 전체보기 (38) 썸네일형 리스트형 파이썬 기반 머신러닝(ML) 모델로 수요예측하기: 시계열 데이터 예측(time-series forecasting) 가이드 안녕하세요오늘은 파이썬 환경에서 머신러닝(Machine Learning) 모델을 활용하여 시계열 데이터를 예측하는 방법,구체적으로는 '수요 예측' 방법 튜토리얼을 작성해보려고 합니다. 시작하기에 앞서,시계열 데이터가 무엇인지부터 간단하게 언급하고 넘어가겠습니다. 시계열 데이터(time-series data)는 시간의 흐름에 따라 관측값이 순차적으로 기록된 데이터를 말합니다. 쉽게 말해서 "시간에 따라 변하는 값"을 포함하는 데이터를 의미하는데요, 대표적인 예시로 기온 변화 데이터, 주식의 일별 데이터, 제품 판매량 데이터 등이 있습니다. 이런 데이터들은 모두 시간 순서가 중요한 대표적인 시계열 데이터입니다.그 중에서도 이번 글은 베이커리 판매량 데이터를 활용해보려고 합니다.실제로 빵집에서는 매일매일 상품.. [논문공부] Learning Transferable Visual Models From Natural Language Supervision - CLIP 논문 논문 제목: Learning Transferable Visual Models From Natural Language Supervision출판 학회: ICML? Open AI 논문출판 연도: 2021년 Abstract기존의 computer vision: 추가 라벨링 데이터가 필요한 supervised learning 형태대안으로, 이미지에 대한 raw text로부터 다이렉트하게 학습하는 것이 제안되었다.본 논문에서는, 어떤 캡션이 어떤 이미지와 짝을 이루는지를 예측하는 단순한 사전학습 과제가, 이미지 표현을 스크래치부터 학습하기 위한 효율적인 방법을 보여준다. 사전학습 시에, 400만개의 (이미지, 텍스트) pair 데이터셋을 사용했고, 사전학습 이후에는 학습된 visual concept들을 지칭하는데 자.. [논문 공부]MSDM: GENERATING TASK-SPECIFIC PATHOLOGY IMAGES WITH A MULTIMODAL CONDITIONED DIFFUSION MODEL FOR CELL AND NUCLEI SEGMENTATION 아카이브 논문2025.10.20링크드인에서 우연히 본 논문인데 biology 분야에서 생성모델을 어떻게 활용하는지 궁금했던터라 한번 살펴보기로 결심했다. 요약을 먼저 하자면,이 논문에서는 세포, 핵 segmentation을 위해 병리 이미지를 생성하는 MSDM이라는 모델을 제안하고 있다. 결과적으로 segmentation model이 다양한 병리 이미지를 잘 분할하지 못하는 문제를 해결하고 싶었던 것 같은데, 이 논문에서는 segmentation model 자체의 모델 (구조) 개선이 아니라, 모델은 기존에서 잘 사용되는 모델을 그대로 사용하되, 성능을 개선하는 보조적인 방법으로써 데이터 증강을 시도했고, MSDM을 통해 합성한 병리 image-mask 쌍을 학습 데이터에 추가하여 데이터 증강을 함으로써.. [논문 공부] Generative Adversarial Nets adversarial process를 이용한 generative model두 개의 모델을 동시에 train1. generative model G데이터 분포 captureD가 실수할 확률을 maximize하도록 train화폐 위조자2. discriminative model D샘플이 training data(실제 데이터, G가 생성한 데이터X) 로부터 나왔을 확률 추정화폐 위조자를 detect하는 경찰=> 이 둘이 서로 경쟁하는데, G에서 생성된 게 진짜 데이터와 구별할 수 없을때까지 반복 이 논문에서는 특별한 case: adversarial nets에 대해 다룸.- generative model: multilayer perceptron을 통해 random noise를 passing하면서 샘플 생성- dis.. [논문 공부] A joint analysis of single cell transcriptomics and proteomics using transformer 논문 제목: A joint analysis of single cell transcriptomics and proteomics using transformer출판연도: 2025년 1월학회/저널: npj Systems Biology and Application(Nature Publishing Group) AbstractCITE-seq은 단일 세포 수준에서 RNA 발현량과, 단백질 발현량을 동시에 측정할 수 있는 강력한 방법이지만, 높은 실험 비용이 발생한다는 한계를 지니고 있다. 따라서, 본 논문에서는 scTEL이라는 새로운 딥러닝 프레임워크를 제안한다.scTEL은, transformer encoder layers에 기반하였고, 시퀀싱된 RNA 발현으로부터, 같은 세포 내의 unobserved prote.. [논문 공부] scButterfly: a versatile single-cell cross-modality translation method via dual-aligned variational autoencoders 논문 제목: scButterfly: a versatile single-cell cross-modality translation method via dual-aligned variational autoencoders출판 날짜: 2024년 6월키워드: scButterfly, VAE, cross-modality translation, multi-omics Abstract각각의 세포에서 multi-omics를 동시에 profiling하는 최근의 발전은 세포 이질성, 분자 계층 구조 연구를 가능하게 했다. 하지만, 기술적인 한계로 인해 이를 동시에 측정할 경우 비용 문제와, noisy한 데이터가 얻어진다는 한계가 존재한다. 본 논문에서는 dual-aligned variational encoder와 data aug.. [논문 공부] scGPT: toward building a foundation model for single-cell multi-omics using generative AI 제목: scGPT: toward building a foundation model for single-cell multi-omics using generative AI출판: Nature Methods(2024년 2월)키워드: scGPT, foundation model, generative pretraining 중요도Introduction, Abstract > Methods > Discussion > (Background) > Results AbstractFoundation model을 개발함에 있어서 large-scale diverse datasets + pretrained transformer의 조합이 등장하였다. 이 조합은 세포생물학에서도 사용될 수 있는데, 그 이유는 언어에서 text가 word의.. GPT 구조 이해하기 GPT (Generative Pre-trained Transformer) pretrained된 모델로, 이후 fine-tuning 과정 없이, 즉 별도의 추가적인 데이터 없이 다양한 task에서 뛰어난 성능을 보였다. 모델 이름에 Generative가 들어가있듯이, 다음에 올 토큰을 '생성'하는 언어 모델이다. fine-tuning을 위한 추가적인 데이터는 학습하지 않지만, 대신 자연어로 이루어진 예제를 제공하는 방식으로 task를 해결한다. Few shots 방법에서는 여러 개의 예시를 주며, 이때 파라미터 업데이트는 일어나지 않으므로 학습이 일어나지는 않는다. 이외에도 one shot, zero shot이 있는데, one shot은 오직 하나의 예시만을 제공하는 경우, zero shot은 예시를 주지.. 이전 1 2 3 4 5 다음