本项目最初是当作 cv 算法工程师实习内推表、校招可投递公司汇总以及个人面经的汇总,后面逐步转变为个人 cv 算法工程师成长之路所记录的技术栈笔记、以及少部分面经等内容。
项目部分内容参考自 github
项目/网络博客/书籍和 个人博客 等,由于时间和精力有限,有些知识点还没有没有完成,请见谅。
GitHub
已经支持直接显示latex
公式,部分公式如果显示不全,也可在谷歌浏览器安装 MathJax Plugin for Github 插件访问(需要翻墙下载安装),或者下载仓库到本地,使用Typora
软件阅读,也可以使用安装了Markdown+Math
插件的VSCode
软件阅读。
作为一个计算机视觉算法工程师,需要掌握的不仅是计算机编程知识,还需要掌握编程开发、机器学习/深度学习、图像识别/目标检测/语义分割、模型压缩、模型部署等知识点,我整理了一个 技术栈思维导图。
强调一下如何从“零”起步,首先确保基础打好。建议完整修完一门国外经典课程(从课程视频、作业到项目),然后完整阅读一本机器学习或者深度学习教科书,同时熟练掌握一门基本的编程语言以及深度学习框架。(参考 中国人民大学赵鑫:AI 科研入坑指南)
深度学习基础的和
Python
编程基础知识总结。
鉴于 2019 年写的春招算法实习岗位表绝大部分已经失效,本人也再无精力维护,故将其移除,故不在展示在仓库主页上。
虽然算法工程师可投递的公司是较多的,但是岗位提供的 hc
是不及开发多的,这点需要注意。以下表格侧重于计算机视觉算法和算法优化/部署工程师岗位。
top 级公司 | 互联网公司 | AI独角兽公司 | 其他大公司 |
---|---|---|---|
百度 | 美团 | 地平线机器人 | 顺丰科技 |
阿里巴巴 | 滴滴出行 | 图森未来 | 招银网络科技 |
腾讯 | 拼多多/菜鸟网络 | momenta | 平安科技 |
字节跳动 | 京东 | 小马智行 | cvte |
微软 | 网易 | 蔚来汽车 | 海康威视 |
谷歌 | 快手 | 小鹏汽车 | 虹软科技 |
商汤 | 爱奇艺 | 科大讯飞 | 传音手机 |
英伟达 | 小米 | 寒武纪/依图 | 大华 |
博世 | 陌陌 | 旷视 | 荣耀手机 |
大疆无人机 | 美图MTlab | 文远知行 | 联想 |
蚂蚁金服 | 360安全 | 云天励飞 | 汇顶科技 |
Intel/亚马逊 | 搜狗 | 摩尔线程 | 美的中央研究院 |
华为 | 猿辅导 | 思必驰 | 锐明技术 |
无 | 新浪/搜狐/金山 | 奥比中光 | 联发科 |
无 | YY/虎牙/BIGO/斗鱼 | 优必选 | 联影医疗 |
无 | oppo/vivo/一加 | 度小满金融 | 戴尔 |
无 | 贝壳找房 | 深睿医疗 | TP-LINK |
无 | 携程/去哪儿/途家 | 镁佳科技 | ZOOM |
无 | 瓜子二手车 | 猎豹移动 | 广联达 |
无 | 作业帮/VIPKID/好未来 | 京东数科 | 深信服 |
无 | 阅文集团/58集团 | 追一科技 | 中国电信云计算 |
无 | B站 | 深兰科技 | 三星电子研究所 |
无 | 小红书/英语流利说 | 明略科技 | 苏宁 |
无 | 趣头条/一点资讯 | 数美科技 | 微众银行 |
无 | 知乎 | 驭势科技 | 中国移动成研院 |
无 | 蘑菇街 | 随手科技 | 远景智能 |
无 | 转转 | 智加科技 | 牧原智能科技 |
无 | 同花顺/老虎证券 | 壁仞科技 | 便利蜂 |
无 | 乐信/有赞 | 趋势科技 | 中兴 |
无 | 金蝶软件(中国) | 云从科技 | 航天二院706所 |
无 | 汽车之家 | 第四范式 | 吉利汽车 |
无 | 珍爱网/酷狗音乐 | 黑芝麻智能 | 碧桂园机器人 |
无 | 巨人网络/盛大游戏 | 格灵深瞳 | 华米/极米 |
无 | 最右/快看漫画 | 码隆科技 | 无 |
无 | 猫眼娱乐/多牛传媒 | 轻舟智航 | 无 |
更多知识和最新博客,欢迎扫码关注我的公众号-嵌入式视觉,记录 CV
算法工程师成长之路,分享技术总结、读书笔记和个人感悟。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科 研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE ),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI助力,做PPT更 简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
高分辨率纹理 3D 资产生成
Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。
一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。
3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号