이번 논문은 이번에 제출을 목적으로 한 저널에서 출판된 논문 중 하나 입니다. 많은 논문 중 해당 논문을 선택한 이유는 다음과 같습니다.
1. 동일 주제. 작성 중인 논문과 동일한 주제인 작물 질병에 관한 논문이기에 참고할 내용이 많을 것으로 판단했습니다.
2. 최신 논문. 2022년 2월에 출판된 따끈따끈한 논문이기에 저널의 트랜드를 파악하기 적합하다고 생각했습니다.
해당 논문과 다른 논문을 분석해보니, 해당 저널은 기술의 신규성 보다는 활용성에 더 큰 관점을 두는 것으로 판단하였습니다. 그렇다보니 컴퓨터 비전 분야에서의 통찰을 얻기에는 부족하니 감안하시기 바랍니다.
추가로 이번 리뷰는 추후 논문 작성에 있어 참고 자료로 남기는 것이 주된 목적임을 알려드립니다.
Intro
++ 작성에 있어 인트로가 가장 어렵고, 농업 분야 측면에서의 이야기가 가장 많이 나오기에 추후 참고를 위해 논문 내용을 의역하여 작성하고 리뷰하는 방식으로 작성했습니다. 빠르게 읽기 원하시는 분들은 Method부터 읽으셔도 이해하시는 데에 문제 없습니다.
토마토는 전세계적으로 연간 18,000만톤을 소비하는 대중적인 작물이며, 아시아는 토마토 최대 생산 지역이자 최대 소비 지역입니다. 그러나 토마토는 질병과 해충에 큰 영향을 받으며, 이를 정밀하게 검출하는 작업은 매우 어렵습니다.
=> [질병 검출의 중요성] 토마토 생산의 중요성에 있어 아시아가 왜 어필한지 모르겠음. 또한 의외로 농업 측면에서 이야기는 이후에도 생각 이상으로 적게 등장함.
전통적으로 질병을 검출하기 위해서 전문가의 시각과 경험을 이용하였으나, 이는 고비용과 비효율적이고 낮은 신뢰도를 보일 가능성이 있습니다. 심지어 베테랑 농학자라도 다양하고 유사한 작물과 질병으로 인해 정확한 질병 검출에 실패하는 경우도 있습니다. 또한, 기후 온난화로 인해 질병의 발생 및 확산이 빠르게 증가하고 있습니다. 그러므로 작물 질병에 대한 자동 검출은 대량의 작물 손실을 방지하기 위해 반드시 필요하게 됩니다.
=> [질병 검출의 필요성] 다른 논문도 해당 문단과 유사한 방식으로 풀이하는 경향이 있음. 저자 사용한 참고 문헌이 주장하는 내용을 주제로 연구된 논문이 아니기에 보다 확실한 뒷받침을 해주는 참고 문헌을 찾을 필요성이 있음
CNN은 자동으로 영상 특징을 검출하여 영상 분류와 검출에 있어 매우 강력한 딥러닝 알고리즘 입니다. 그렇기에 많은 분야에서 CNN을 적용하기 시작했습니다. CNN은 1980년대 Neocognition과 LeNet을 통해 등장하였으며, GPU를 사용한 AlexNet이 ImageNet에서 큰 성과를 얻으면서 각광 받기 시작하였습니다.
=> 굳이 왜 있는 거지… 자동화된 작물 질병 검출과 컴퓨터 비전 간의 연결 고리로 사용한 문단으로 보이나, 굉장히 부자연스러움. 해당 문제에 대해서 매우 많은 고민을 하고 있으며, 참고할 자료를 많이 찾아봐야 할 듯.
컴퓨터 비전은 작물 품질 검사, 질병 식별, 작물 모니터링 및 관리와 같은 농업 영역에서 널리 사용되고 있습니다. 특히, 식물 병리학(Phytopathology)은 컴퓨터 비전을 가장 많이 활용하는 분야 중 하나입니다. 하지만 작물 질병의 정밀한 검출은 배경으로 인한 노이즈, 일부 질병의 유사성으로 인해 어렵습니다.
하지만 CNN은 장비와 기술의 발전으로 점진적으로 발전해왔습니다.~ 요약… 관련 연구… 주로 경량화 측면에서 비교를 하기 위해 경량화에 대한 관점에서 관련 연구를 풀이
해당 연구에서는 ResNet 분파의 20계층으로 구성된 경량화 CNN에 4가지 attention module을 추가한 모델을 설계하여 작물 질병에서의 분류 성능 평가를 진행하였다. 따라서 주요 목적은 작물 질병 분류를 위한 가볍고 효율적인 네트워크를 설계하여 attention module을 수정하며 기존의 CNN의 성능 개선함으로써, 효과적이고 효율적인 attention module을 식별하는 것입니다.
=> 즉, ResNet을 20계층으로 수정한 모델에 기존에 제안된 4가지 attention module을 추가하여 실험을 하였고, 이에 대한 성능 평가를 통해 누가 더 좋은지 찾겠다는 이야기.
Meterials and Methods
++여기부터는 이전에 제안된 방법에 대해 풀이하는 방식. 기존 방법론에서 제안된 부분은 빠르게 넘어가도록 하겠습니다.
Data Collection and Preprocessing
저자는 토마토 질병 검출을 위해 PlantVillage Dataset 중 토마토 클래스를 이용하였으며, 추가로 Fusarium wilt(시들음 병)에 대한 데이터를 추가로 취득하여 실험을 진행했다고 합니다. 이를 통해 총 19,510장의 영상이 사용되었으며, 이를 8:1:1(train:val:test)로 나눠 학습과 평가를 진행하였습니다.
Lightweight Attention-Based Network Design
++ 해당 섹션에서는 4가지 attention module을 소개합니다. 컴퓨터 비전 분야에서 제안된 방법을 요약하여 소개하는 방식을 사용하였으며, 그외의 내용은 따로 작성하지 않고 튜토리얼 느낌으로 작성하여 그림과 참고 문헌만 걸어두겠습니다.
저자는 fig 2과 Table 2와 같이 layer 3(Residual block3)과 layer 4(Residual block4) 사이에 attention module을 추가하여 실험을 진행하였습니다.
Convolutional Block Attention Module (CBAM)
Squeeze-and-Excitation (SE) Attention Module
Self-Attention (SA) Module
++ SA에 대한 참고 문헌을 어떻게…
Dual Attention (DA) Module
Network Training and Evaluation
4가지 모듈은 공평한 실험을 위해 동일한 데이터 셋과 동일한 하이퍼 파라미터를 사용하였습니다. 또한… Table 3과 같은 데이터 증강 기법을 사용하였습니다. 또한 분류 성능 평가식으로 대중적으로 많이 사용되는 ACC와 Precision, Recall, F1을 사용하였으며, 경량화를 평가하기 위해 FLOPs를 사용하였습니다.
++아래의 표와 같이 데이터 증강으로 8배 증가시켰다는 표도 넣었네요…
Results (Experiment)
Training, Validation, and Testing Accuracy of the Models
Fig 7을 통해 베이스 모델인 lw_resnet20이 다른 attention을 추가한 모델보다 상대적을 ㅗ느린 속도로 학습되는 것을 볼 수 있다고 합니다. 또한 lw_resnet20_se가 상대적으로 빠른 속도로 학습이 되는 모습을 보여준다고 합니다.
++ 시각화가 심각한 수준으로 이야기하는 내용을 전혀 받아드릴 수가 없음. 반면교사로써 적절한 예시에 해당한다고 생각
Network Parameters and Efficiency
제안한 모델은 ResNet50 대비 16~23배 파라미터가 적은 것을 Table 7을 통해 확인 가능하며, 평균적인 속도, FLOPs, ACC에서 뛰어난 결과를 통해 제안된 방법의 효율성을 보이고자 했습니다. +또한, 각 모듈간 비교 내용을 Table 7에 대한 분석을 담고 있지만, Table 7에 대한 해석에 대한 내용만 있고 추가적인 분석은 없어 따로 없네요…
++ 실험 섹션에서 최종적으로 경량화 모델에서는 분류 성능에서는 CBAM이 가장 좋고, 속도 면에서는 attention 모듈을 사용하지 않은 lw_resnet20이 가장 좋다는 결론이 났습니다. 하지만 이에 대한 심도 깊은 분석은 이뤄지지 않고 작성된 표를 읽어주는 방법만 취하고 있습니다.
=======================================================
해당 논문의 기여는 데이터 클래스를 추가하고, 농업 분야에서 활용성 높은 경량화 모델을 설계하여 attention module을 추가를 통한 성능 개선 정도에 대한 실험 입니다.
다만, 아쉬운 점은 컴퓨터 비전 측면에서의 심도 깊은 분석이 전혀 이뤄지지 않았습니다. 해당 모듈 별 성능 차이 원인 분석 혹은 적어도 장단점이라도 있었으면 좋았을 텐데 말입니다.
하지만 해당 저널은 농업 분야이기에 컴퓨터 비전 분야 측면의 분석이 없는 것이 크리티컬한 이슈로 적용되지 않은 것으로 보입니다.
즉, 해당 저널은 비전 혹은 알고리즘에 대한 심도 깊은 분석보다는 튜토리얼 급의 친절한 설명과 이해하기 쉬운 실험과 평가가 더욱 중요하다고 볼 수 있습니다.