找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1686

积分

0

好友

220

主题
发表于 3 天前 | 查看: 15| 回复: 0

前段时间在推特上看到Google的开发倡导者Jack Wotherspoon发了一条消息,说他与DeepLearning.AI合作推出了一门关于Gemini CLI的免费课程。

有吴恩达老师站台,这课程我肯定得仔细瞧瞧。

Jack Wotherspoon发布的Gemini CLI课程推特截图

实际上我关注Gemini CLI这个工具比较早了,去年七月份就写过相关的入门教程。这次看到Google开始在终端AI编程这个领域布局教育内容,还挺让人好奇的。今天就来聊聊这个工具以及这门课程到底怎么样。

Gemini CLI 是什么?

对于从深度学习时代过来的朋友来说,DeepLearning.AI应该不陌生,这是吴恩达创办的平台,上面有大量高质量的免费AI短课程。这次Google与其合作推出的课程,主角就是Gemini CLI。

简单来说,Gemini CLI是Google推出的一个开源终端AI Agent。它和大家熟悉的Claude Code类似,能让你直接在命令行里调用Gemini模型的能力,帮你完成写代码、修复Bug、管理文件、执行Shell命令等任务。

一行命令即可安装最新版本:

npm install -g @google/gemini-cli@latest

需要Node.js 20以上的运行环境。安装完成后,使用个人Google账号登录即可开始使用,无需额外的付费订阅操作。

Gemini CLI启动界面

聊几个关键的技术细节。

模型方面,Gemini CLI默认使用Gemini 3.0 Pro模型,上下文窗口高达100万token。这个容量大致可以装下一个中大型项目的全部源代码,与目前Claude Code的上下文能力处于同一量级。

Gemini CLI模型选择菜单

免费额度是Gemini CLI最具吸引力的地方:每分钟60次请求,每天1000次。对比一下Gemini标准API的免费版(每分钟2次,每天20次),这简直是给CLI用户开了超级VIP通道,这种诚意在同类工具中独一档。

开源方面,Gemini CLI采用Apache 2.0协议完全开源,代码库托管在GitHub上:
https://github.com/google-gemini/gemini-cli

技术实现上,Gemini CLI采用ReAct循环(Reasoning and Acting),配合内置工具和MCP(Model Context Protocol)服务器来执行复杂任务。

此外,Gemini CLI还有一个智能的自动路由机制。简单任务会自动分配给更快的Gemini Flash模型处理,复杂任务才会调用能力更强的Gemini Pro模型。这个设计很巧妙,能在响应速度和处理质量之间自动取得平衡。

值得一提的是,国内阿里的通义灵码(Qwen Code),其底层便是基于Gemini CLI的开源项目进行二次开发而来的。

这门免费课程讲了什么?

课程全称是 “Gemini CLI: Code & Create with an Open-Source Agent”,讲师Jack Wotherspoon是Google的高级开发者倡导者。

DeepLearning.AI课程页面截图

总时长1小时13分钟,包含11节视频课程,定位为入门级,完全免费。

课程视频目录界面

课程访问地址:
https://www.deeplearning.ai/short-courses/gemini-cli-code-and-create-with-an-open-source-agent/

配套的代码仓库也已开源:
https://github.com/https-deeplearning-ai/sc-gemini-cli-files

我将11节课的内容梳理如下:

  • 前三节是基础篇:介绍Gemini CLI是什么、功能导览、以及核心的GEMINI.md上下文配置文件。
  • 中间三节是进阶篇:涵盖MCP工作流、Extensions扩展自定义、以及实际的软件开发实战。
  • 后面三节是拓展篇:分别探讨数据分析、内容创作和学习辅助等应用场景。
  • 最后一节是总结

课程中的实战项目很有意思,模拟为一个AI会议进行全套开发。你需要使用Gemini CLI搭建会议网站的Session目录,结合本地与云端数据源创建数据仪表盘,还要从会议录音中生成社交媒体宣传内容。一个项目串联起了软件开发、数据处理和内容生成三个典型场景,覆盖面很广。

课程中有一个重点我想单独强调:GEMINI.md

用过Claude Code的朋友对CLAUDE.md应该不陌生。它就是在项目根目录放置的一个Markdown文件,用于告诉AI本项目使用的技术栈、编码规范和特殊要求。Gemini CLI的GEMINI.md作用完全相同,是为AI提供项目级上下文指令的配置文件。

GEMINI.md有一个设计比较巧妙:分层加载。全局配置放在 ~/.gemini/GEMINI.md,项目配置放在项目根目录,子目录下还可以放置更细粒度的配置。这三层上下文会被自动合并,从通用到具体逐层叠加。此外,它还支持使用 @file.md 的语法导入其他文件,方便将大型配置拆分为多个模块管理。

这个思路与CLAUDE.md的设计逻辑基本一致。这其实也说明,在终端AI Agent这个赛道上,各家工具的产品设计已经趋于同质化。项目上下文文件、MCP支持、ReAct循环,这些几乎成为了标配功能。

从一个Claude Code用户的视角看

坦白说,我目前主力的终端AI编程工具是Claude Code,短期内没有更换的计划。但Gemini CLI这个东西确实值得关注。

原因很简单:它的免费额度实在太有吸引力了。

Claude Code的使用绑定在Anthropic的订阅套餐里,要么按API调用token计费,要么购买Max订阅。对于重度用户来说,每月成本不低。而Gemini CLI仅需一个个人Google账号,就能每天免费调用1000次Gemini模型,这个性价比确实无可挑剔。

对于刚入门AI编程的朋友而言,这门课程加上Gemini CLI的免费额度,基本上就是零成本上手终端AI Agent完整工作流的最佳路径。以前想体验这套流程,要么花钱订阅,要么自己折腾API配置,门槛不低。现在Google把工具免费给你,还把教程免费教你,这一套组合拳确实将入门成本打到了近乎为零。

我之前写过一篇关于斯坦福CS146S课程的文章,那是一门为期10周的大学正式课程,教授的是Vibe Coding的完整方法论和工作流。而DeepLearning.AI这门课仅用1小时13分钟,聚焦于Gemini CLI这一单一工具的实际操作。一个偏重理论与方法论,一个偏重动手与实践,定位不同但恰好形成互补。

关于MCP也顺便提一下。课程专门用了一节来讲MCP工作流,演示如何通过MCP连接Google Workspace、Canva等外部服务。MCP作为AI工具的通用连接协议,你在Gemini CLI中学到的使用思路,完全可以迁移到Claude Code等其他支持MCP的工具上,这部分知识是通用的。

终端AI编程这个赛道,从2025年至今,已经从Claude Code一家独大发展为多方混战的局面。Google有Gemini CLI,GitHub有Copilot CLI,OpenAI有Codex CLI,还有各种社区开源方案。竞争对用户来说是好事,工具越“卷”,免费额度可能越多,整体体验也会越好。

如果你还没用过任何终端AI编程工具,那么Gemini CLI加上这门免费课,是一个相当不错的起点。如果你已经是Claude Code或其他工具的用户,也建议抽空了解一下Gemini CLI的设计思路,多掌握一个工具总没有坏处。

Google这波操作,确实把终端AI编程的入门成本压到了几乎为零。工具免费,课程也免费,单凭这一点,就值得让更多开发者知道。如果你想系统地学习这类工具,不妨到云栈社区的技术论坛看看,那里有更多开发者分享的实战经验和学习资源。

说句题外话,我个人其实希望谷歌未来能将Gemini CLI这类AI编程工具转向更可持续的订阅收费模式。只有这样,才能投入更多资源进行长期迭代和优化,使其真正成长为成熟可靠的生产力工具。




上一篇:项目管理做不好?问题在战略与执行脱节,而非团队不力
下一篇:操作系统文件管理:深入解析外存分配的三种核心方式与场景选择
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 10:26 , Processed in 0.763587 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表