본문 바로가기

분류 전체보기

[Paper] VadCLIP: Adapting Vision-Language Models for Weakly SupervisedVideo Anomaly Detection VadCLIP: Adapting Vision-Language Models for Weakly Supervised Video Anomaly Detectionhttps://ojs.aaai.org/index.php/AAAI/article/view/28423 VadCLIP: Adapting Vision-Language Models for Weakly Supervised Video Anomaly Detection | Proceedings of the AAAI Conferen ojs.aaai.orgWu, P., Zhou, X., Pang, G., Zhou, L., Yan, Q., Wang, P., & Zhang, Y. (2024, March). Vadclip: Adapting vision-language model.. 더보기
[Paper] CLIP4Clip: An Empirical Study of CLIP for End to End Video ClipRetrieval 논문링크 CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip RetrievalVideo-text retrieval plays an essential role in multi-modal research and has been widely used in many real-world web applications. The CLIP (Contrastive Language-Image Pre-training), an image-language pre-training model, has demonstrated the power of visuaarxiv.orgClip의 경우 Image-Text 간의 유사도를 계산하는 방식일반적으로 Video Retrieva.. 더보기
[Paper] CLIP - Learning Transferable Visual Models From Natural Language Supervision 이 글에서는 OpenAI의 유명 모델인 CLIP이 소개된 논문 Learning Transferable Visual Models From Natural Language Supervision에 관해 리뷰해보려 한다. 🟥 CLIP해당 논문에서 소개하는 모델이 CLIP이라고 불리는 이유는 논문에서 'which we call CLIP, for Contrastive Language-Image Pre-training' 라고 소개하고 있기 때문이다. 해당 모델은 나무위키에도 있을 정도로 유명 모델이라고 할 수 있다.https://namu.wiki/w/CLIP%20%EB%AA%A8%EB%8D%B8왜 그런고 하니 CLIP은 텍스트와 이미지를 함께 처리할 수 있는 방법을 제시하였고 그로 인해 AI 그림 생성과 같은 많은 .. 더보기
[머신러닝] 결정트리 🟥결정트리(Decision Tree)의사결정트리, 의사결정나무라고도 하는 결정트리는 분류(Classification)와 회귀(Regression) 모두 가능한 지도 학습 모델의 한 종류이다. 결정트리는 트리 구조를 활용하여 entropy가 최소화 되는 방향으로 데이터를 예측한다. 쉽게 생각하면 스무고개와 비슷하다고 보면 된다. 이러한 결정트리는 1960년대에 처음 등장 하였음에도 XGBoost, LightBGM과 같이 현재까지 발전되어 많이 쓰이고 있다.• 발전과정- Concept Learning System(CLS)(1960년)결정트리는 처음에는 심리학에서 사용되다가 머신러닝에 사용되기 시작했다. 그 처음인 CLS는 얼 헌트에 의해 고안되었으며 처리 방법이 매우 간단하다. 모두 A의 요소이면 Posi.. 더보기
[딥러닝]OpenCV Python의 Filter OpenCV에서 제공하는 2D 이미지에 적용 가능한 선형, 비선형 필터링 함수들에 대해 알아보자. https://docs.opencv.org/4.x/d4/d86/group__imgproc__filter.html OpenCV: Image FilteringFunctions and classes described in this section are used to perform various linear or non-linear filtering operations on 2D images (represented as Mat's). It means that for each pixel location \((x,y)\) in the source image (normally, rectangular), its neigd.. 더보기
[딥러닝]Positional Encoding (with Positional Embedding) Transformer 기반의 모델들이 우수한 성능을 보여주면서 그 활용도가 점점 높아지고 있다. 그리고 Transformer 모델을 소개하는 논문 "Attention is All You Need"에서 Positional Encoding라는 방법 또한 처음 등장하게 되었다. 이후 Transformer 기반의 자연어 모델들이 우수한 성능을 보였고 BERT 모델에서는 Positional Embedding을 사용하였다. 그러나 요즘 Positional Encoding과 Positional Embedding에 차이가 있음에도 이를 혼용하여 사용하고 있는것 같아 이에 관해 자세히 정리해보려고 한다.🟥 Encoding / Embedding먼저 Encoding과 Embedding이 무엇인지 어떤 차이가 있는지부터 확.. 더보기
[코드트리] 고대 문명 유적 탐사 문제링크https://www.codetree.ai/training-field/frequent-problems/problems/ancient-ruin-exploration/description?page=1&pageSize=20 코드트리 | 코딩테스트 준비를 위한 알고리즘 정석국가대표가 만든 코딩 공부의 가이드북 코딩 왕초보부터 꿈의 직장 코테 합격까지, 국가대표가 엄선한 커리큘럼으로 준비해보세요.www.codetree.ai처음엔 BFS로 쉽게 할 것 같았는데이상한 곳에 꽂혀서 8시간 동안 헤맨 문제...(Flood Fill도 필요하다) 회전의 중심을 1, 1에서 시작하고그 다음은 2, 1에서 시작하도록 코드를 짜는거 까진 좋았는데,1,1을 중심으로 회전한 이후 board를 업데이트 하는게 아니라기존 boa.. 더보기
[코드트리] 격자 숫자 놀이 문제링크https://www.codetree.ai/training-field/frequent-problems/problems/matrix-number-play/description?page=3&pageSize=20 코드트리 | 코딩테스트 준비를 위한 알고리즘 정석국가대표가 만든 코딩 공부의 가이드북 코딩 왕초보부터 꿈의 직장 코테 합격까지, 국가대표가 엄선한 커리큘럼으로 준비해보세요.www.codetree.ai numpy를 이용해서 남들과 다르게 풀어보기그치만 코드 실행하면 정상 제출 되지는 않는다는 점! 분명 일반 리스트보다 numpy를 이용하면코드 실행 속도가 빨라서 좋을텐데 🤔🤔 ※ 사용하고자 하는 리스트의 길이가 짧은 경우zip함수와 numpy의 transpose에 큰 차이가 없겠지만그 길이가.. 더보기