谷歌近期宣布推出一款新的Visual Studio Code扩展,可将本地笔记本连接到Colab运行时。此举旨在弥合本地开发环境与基于Web的Colab环境之间的鸿沟。
根据官方说明,开发团队通过社区反馈(包括博客文章、论坛帖子和记录变通方案的GitHub仓库)发现了这两种环境之间存在割裂。过去,用户通常在定制化的VS Code环境中进行项目开发,而在基于Web的Colab环境中执行笔记本、进行可视化以及运行训练/推理工作负载。
借助这款新的VS Code Colab扩展,开发者现在可以在同一个驱动其开发工作流的VS Code编辑器内,直接将本地笔记本连接到Colab运行时(包括提供高级GPU和TPU的Pro层运行时)来使用Colab。
对于Colab用户而言,新扩展支持多种常见工作流,例如在大型项目或Git仓库中处理笔记本。与基于Web的Colab编辑器相比,他们还能受益于VS Code更强大的IDE功能。机器学习工程师Wesley Kambale指出了该集成带来的几种高级工作流,例如使用RAPIDS cuDF对大型数据集进行GPU加速分析、在VS Code内生成艺术图像等。Kambale评价该扩展:
使开发者和ML工程师能够在其偏好的编辑器内直接利用免费的GPU和TPU,从而简化工作流程并加速创新。虽然仍处于早期阶段,但该扩展标志着在使人工智能与机器学习开发更易访问、更高效方面迈出了重要一步。
正如谷歌开发者Glen Yu所解释的,Colab最初设计为基于Web的界面,包含了一些无法在VS Code中完全复现的功能。特别是,开发者无法通过userdata.get()访问用户数据,也无法使用drive.mount()挂载Google Drive。Yu在其文章中还描述了如何使用Colab扩展,通过LoRA调优来微调gemma_instruct_1b模型,并管理访问外部服务ML模型所需的密钥。
已知问题及其解决方法的完整列表可在colab-vscode扩展的GitHub仓库中找到。Colab团队也表示,在确定缺失功能的开发优先级时,会考虑GitHub议题上的投票情况。
在该VS Code扩展可用之前,开发者依赖一些变通方法来连接两个环境。一种常见方法是利用GitHub和Git在本地处理笔记本,将其推送到代码仓库,然后在Google Colab中打开。对于更高级的集成,一些开发者使用从本地机器到Colab运行时的远程隧道。对于简单的工作流,开发者也可以直接从Colab连接到Google Drive存储。
|