Kylin Page

A fool who dreams.

Notes for Machine Learning Compilation

机器学习编译Notes

[TOC] Intro official notes: https://mlc.ai/chapter_auto_program_optimization/index.html What’s MLC? Machine learning compilation (MLC) is the process of transforming and optimizing machine lear...

入门 3D Reconstrucion

Code Cookbook for 3D Reconstrucion

[TOC] Basic Concepts Structure from Motion (SfM) 从一组2D图像中重建环境的3D模型的过程被称为从运动中获得结构 Epipolar Geometry Essential Matrix & Fundamental Matrix Fundamental Problem in 3D-Reconstruction Method ...

C++ Basics

面试复习

[TOC] 内存管理 ELF 文件: 可执行与可链接格式 (Executable and Linkable Format) 是一种用于可执行文件、目标代码、共享库和核心转储 (core dump) 的标准文件格式,每个 ELF 文件都由一个 ELF header 和紧跟其后的文件数据部分组成,可以参考 ELF 文件的构成如下: .text section:代码段。...

ByteDance Robots in AI Lab

算法岗面试细节整理

[TOC] 一面 自我介绍 项目介绍,主要追问了论文(background、EKF) 算法题:环形链表 算法题:下面c++代码为什么会segment fault #include<iostream> #include<cstring> #include<string> #include<cstdio> #include...

All about ConvNext

Conv is all you need

[TOC] Background Vision Transformer的结构设计越来越像经典CNNs ViT是第一个使用纯Transformer结构做分类的论文 PVT修改了整体结构, 引入了CNNs中的金字塔结构, 使得网络对下游变得友好。 SwinTrans修改了微观操作, 限制了MSA中的交互范围, 降低了复杂度这种改动 模型从整体到微观越来越像经典CNNs ...

All about SparseRCNN

SparseRCNN 论文讲解

[TOC] Background SpaseRCNN 是在 DETR 之后的一个工作,与 Deformable DETR 同期 DETR去掉了 Anchor Generation 和 NMS, 但是在Decoder中,Object Query 和 Feature Map上每一个点要计算一次 Cross Attention,这部分计算仍然是密集的,而这部分操作产生的Attenti...

All About Deformable DETR

Deformable Transformers for end-to-end object detection 论文讲解

[TOC] Background DETR是一个简洁的pipeline,但几乎不可用
DETR提出了一套不同于Dense Prediction的pipeline,将检测视为一个Set Prediction问题,成功去掉了Anchor Generation和NMS。 Problem 计算量问题:但是在实际使用中,DETR在训练阶段面临难以收敛的困难,正常模型最多需要36个ep收敛,DE...

End-to-End Object Detection With Transformers

DETR 论文讲解

[TOC] Transformer在DET中的应用 transformer 的使用分两类: Backbone ViT PVT Swin Task specific module 发现现存方案的缺点、使用trans解决这些问题 DETR ...

All about Masked AutoEncoders

MAE 论文讲解

[TOC] Background Transformer从NLP到CV的迁移过程中,既然模型统一了,那么训练方法是否可以统一? NLP中的训练方法: 输入一个句子,盖住其中的几个词,然后要模型预测出盖住的词 这样训练与分类任务的区别: 这是一个无需Label的任务,意味着不需要标数据 这是一个重建任务,意味着需要更多的信息 非常自然的能够想到CV中可以这样训练...

Ubuntu 安装中文输入法

Ubuntu FireFox 安装中文输入法

[TOC] Ubuntu 安装中文输入法 安装中文语言包 sudo apt-get update sudo apt-get install language-pack-zh-hans 安装输入法 sudo apt install ibus-libpinyin sudo apt install ibus-clutter reboot reboot ...