전체 글167 [논문리뷰] Unsupervised Visual Representation Learning by Context Prediction 이 논문은 "Unsupervised Visual Representation Learning by Context Prediction"라는 제목으로, Carl Doersch 외 2명이 2015년에 발표한 연구입니다. 연구진은 이미지 내 패치들 간의 상대적 위치 관계를 학습하는 방법을 통해, 라벨 없이도 이미지의 유의미한 시각적 특징을 추출할 수 있는 비지도 학습 기법을 제시했습니다. 이 방법은 특히 값비싼 레이블링 작업 없이도 효과적인 시각적 특징 학습이 가능하다는 점에서 큰 혁신을 보여주었습니다. 이 논문에서는 연구진은 사람이 물체의 일부분만 보고도 전체 맥락을 이해할 수 있다는 점에 착안하여, 이미지에서 임의로 선택한 여러 패치들 간의 상대적 위치를 예측하는 방식으로 모델을 훈련시켰습니다. 구체적으로, .. 2024. 11. 6. [논문 리뷰] U-Net: Convolutional Networks for BiomedicalImage Segmentation 이 논문은 "U-Net: Convolutional Networks for BiomedicalImage Segmentation"라는 제목으로, Olaf Ronneberger 외 2명이 2015년에 발표했습니다.이 논문에서는 생의학 이미지에서 정확한 세분화를 수행할 수 있는 새로운 네트워크 아키텍처인 U-Net을 제안합니다.기존 이미지 세분화 모델의 한계를 지적하며, 적은 데이터로도 효율적인 학습이 가능한 대칭형 인코딩-디코딩 구조를 소개합니다.이 모델은 특징 추출을 위한 컨트랙팅 경로와 세밀한 세분화를 위한 확장 경로로 구성되며, 중간 단계의 스킵 연결을 통해 정보를 보존하면서 고해상도 출력을 생성합니다.특히 U-Net은 의료 영상과 같이 한정된 데이터셋에서도 높은 성능을 유지하여, 생의학 분야의 이미지 .. 2024. 10. 30. [논문 리뷰] Very Deep Convolutional Networks for Large-Scale Image Recognition 이 논문은 "Very Deep Convolutional Networks for Large-Scale Image Recognition"라는 제목으로, Karen Simonyan외 1명이 2015년에 발표했습니다.이 논문에서는 VGGNet이라는 깊은 컨볼루션 신경망(CNN) 구조를 제안합니다. VGGNet은 ImageNet 대회에서 뛰어난 성능을 보였으며, 간단하지만 깊은 네트워크 설계가 특징입니다.핵심은 3x3 크기의 작은 필터를 여러 층에 걸쳐 사용해, 더 큰 수용 영역을 얻으면서도 계산 비용을 줄였다는 점입니다. 이 방식으로 네트워크는 더 복잡한 패턴을 학습할 수 있었고, 성능도 크게 향상되었습니다.또한, VGGNet은 전이 학습에도 적합해 다양한 비전 작업에 활용되었습니다. 이 모델은 이후 많은 신경.. 2024. 10. 17. [논문 리뷰] Sequence to Sequence Learning with Neural Networks 이 논문은 "Sequence to Sequence Learning with Neural Networks"라는 제목으로, Ilya Sutskever 외 2명이 2014년에 발표했습니다.이 논문에서는 Sequence to Sequence(Seq2Seq) 모델을 제안하며, 입력 시퀀스를 고정된 벡터로 인코딩하고 이를 다시 시퀀스로 디코딩하는 구조를 소개합니다. LSTM을 활용하여 긴 의존성 문제를 효과적으로 해결하고, 기계 번역 등 자연어 처리에서 우수한 성능을 보여줍니다. 특히, 인코더의 마지막 은닉 상태를 디코더의 초기 상태로 사용하는 방식이 성능 향상에 중요한 역할을 합니다. 이 모델은 기존의 고정된 길이 입력과 출력을 요구하는 방식의 한계를 넘어서, 다양한 자연어 처리 과제에 널리 적용될 수 있는 강력.. 2024. 10. 9. [논문 리뷰] Efficient Estimation of Word Representations in Vector Space 이 논문은 "Efficient Estimation of Word Representations in Vector Space"라는 제목으로, Tomas Mikolov 외 4명이 2013년에 발표했습니다. 이 논문에서는 단어의 의미를 효율적으로 벡터 공간에 표현하는 Word2Vec 모델을 제안하며, 이는 자연어 처리에 혁신적인 변화를 가져왔습니다.기존 신경망 기반 언어 모델의 한계를 지적하고, 계산 복잡도를 줄이면서도 고품질의 단어 벡터를 학습할 수 있는 Continuous Bag-of-Words와 Skip-gram 아키텍처를 소개합니다. 이 모델들은 대규모 텍스트 데이터에서 단어 간의 문맥적 관계를 효과적으로 포착하며, 학습된 벡터는 유사성 및 유추 관계를 잘 반영합니다.특히, 이 방법들은 기존보다 적은 계.. 2024. 10. 5. [논문 리뷰] ImageNet Classification with Deep Convolutional Neural Networks 이 논문은 "ImageNet Classification with Deep Convolutional Neural Networks"이라는 제목의 논문입니다.작성자는 Alex Krizhevsky 외 2명이며, 2012년에 발표된 해당 논문에서는 대규모 이미지 분류 작업을 위한 심층 합성곱 신경망(Deep Convolutional Neural Network, CNN)을 소개합니다. 이 네트워크는 나중에 AlexNet으로 알려지게 되었으며, 컴퓨터 비전 분야에 혁명적인 변화를 가져왔습니다.논문에서는 5개의 합성곱 층과 3개의 완전 연결 층으로 구성된 대규모 CNN 구조를 제안하고, ReLU(Rectified Linear Unit) 활성화 함수, 데이터 증강 기법, Dropout 정규화 등의 혁신적인 기술을 도입하.. 2024. 10. 5. 이전 1 2 3 4 ··· 28 다음