• +886 986 864 419
  • s0927071101@gmail.com
  • Quick Search:
  • YOLOv7 Objece Detection

    Real-time Model at its Best

  • YOLOv7 Instance Segmentation

    Real-time Model at its Best

  • YOLOv7 Post Estimation

    Real-time Model at its Best


博主:)

歡迎大家跟我一起討論電腦視覺相關主題唷~
Gary Tsai
AI Students

本文將先針對「電腦視覺」中常用的「影像分類(Image Classification)」、「物件偵測(Object Detection)」「實例分割(Instance Segmentation)」及「人體骨架(Human Skeleton)」等幾大領域作簡單的「任務定義」

YOLO

2021 年 Swin-Transformer 霸榜各大電腦視覺任務,Transformer 是為序列建模和轉換任務而設計的, 因為它關注數據的長期依賴性,其在語言領域的巨大成功促使學者研究它對電腦視覺的適應性,本文重點探討將 Transformer 從 NLP 轉移到 CV 的策略。

2021 年以前各大電腦視覺任務主要被 CNN 所統治,CNN 架構已經通過更大的規模,更廣泛的連接,以及更複雜的卷積形式而逐漸壯大。

Transformer

李沐團隊針對自監督學習(Self-Supervised Learning, SSL)的分支對比學習(Contrastive Learning),在電腦視覺領域的發展進行了一個非常好的總結,這幾年真的卷出了非常多的 Trick。

2019 年 Facebook AI 提出的 MoCo 橫空出世,掀起了自監督學習在電腦視覺領域的熱潮,接續 Google Brain 相繼提出 SimCLR,自監督學習呈現出百花齊放,百家爭鳴空前繁榮的景象。但是繁榮的背後,自監督學習經歷了漫長的迭代和發展過程。

Self-Supervised Learning