基于Streamlit与Gemini API构建轻量级AI代码生成与对话工具

张

张建站

2026/5/10 11:05:51

10分钟阅读

1. 项目概述一个基于Gemini的轻量级AI编码伴侣最近在尝试各种AI编码工具时我发现了一个挺有意思的痛点像GitHub Copilot或Cursor这类工具虽然强大但它们要么是IDE插件要么是桌面应用有时候我只是想快速验证一个想法或者临时需要一段代码并不想打开一个庞大的开发环境。于是我动手用Streamlit和Google的Gemini API搭建了一个叫“CursorAISim”的Web应用。本质上它是一个轻量级的、浏览器即开的AI编码伴侣核心目标是把“提问-生成代码-讨论优化-管理片段”这个闭环流程在一个简洁的页面上跑通。这个工具特别适合几种场景当你手头没有安装完整IDE比如在平板或临时用的电脑上当你需要快速给团队演示一个算法或API调用示例或者当你学习新语言、新框架想有个随时能对话、能出代码的“陪练”。它不是一个要替代专业IDE的庞然大物而更像一个随时待命的“代码便签本”和“即时答疑助手”。整个项目用Python写成前端是Streamlit后端逻辑围绕Gemini API构建并用Pydantic来确保数据流转的清晰和稳定。接下来我会详细拆解从环境搭建、核心功能实现到实际使用中踩过的坑和优化技巧。2. 技术栈选型与架构设计思路2.1 为什么选择Streamlit Gemini API这个组合选择技术栈时我的核心诉求是“快速验证”和“极低的前端成本”。Streamlit几乎是为数据科学家和机器学习工程师快速构建交互式应用而生的它用Python脚本就能生成Web界面省去了前后端分离、部署路由、处理HTTP请求等一系列繁琐工作。对于这样一个工具类应用它的st.text_input、st.button、st.chat_message等组件完全够用并且状态管理st.session_state和缓存st.cache_resource机制能很好地支撑起一个会话式应用的需求。后端AI模型的选择上我对比了OpenAI的GPT系列和Google的Gemini。最终选择Gemini API主要是出于几个考虑一是其gemini-2.0-flash模型在代码生成和理解任务上表现相当出色响应速度快成本也相对友好二是Google AI Studio提供了直观的API密钥管理和免费额度对个人开发者和小项目起步非常友好三是其API设计简洁Python SDKgoogle-generativeai集成起来非常顺畅几行代码就能完成初始化、配置和调用。注意虽然项目示例中使用了gemini-2.0-flash但Gemini模型系列更新较快。在实际部署时建议根据任务复杂度在gemini-2.0-flash速度优先、gemini-2.0-pro复杂推理优先或更新的预览版模型间做权衡。模型切换通常只需修改一行初始化代码。2.2 核心数据流与状态管理设计应用的核心数据流围绕着“用户输入 - AI处理 - 结果展示与管理”展开。为了不让代码变成一团乱麻我引入了Pydantic来强制进行数据建模和验证。这步非常关键它让应用的“骨架”清晰可见。我定义了三个核心的Pydantic模型CodeSnippet代表一个代码片段。包含id唯一标识、filename建议的文件名、language编程语言、content代码内容和created_at创建时间戳。这样每个生成的代码块都是一个结构化的对象而不是散落在各处的字符串。ChatMessage代表聊天记录中的一条消息。包含role“user”或“assistant”、content消息内容和timestamp。这为聊天历史提供了清晰的格式。AppState这是应用的“大脑”一个全局状态容器。它包含chat_historyChatMessage列表、code_snippetsCodeSnippet列表、selected_snippet_ids用户勾选准备下载的片段ID集合等。所有动态数据都收纳在这里。使用st.session_state来持久化这个AppState对象。Streamlit脚本在用户每次交互后都会从头到尾重新执行session_state是唯一能跨这些“重跑”保持数据的地方。把状态集中管理避免了状态分散导致的bug也使得调试和功能扩展比如未来添加历史持久化变得容易。2.3 前端布局与交互逻辑规划界面布局采用经典的左右分栏结构这是为了同时满足“代码生产”和“对话讨论”两个核心场景避免功能互相干扰。左侧栏Sidebar放置全局配置和操作。这里最重要的是Gemini API密钥的输入框。出于安全考虑密钥输入使用st.text_input的type“password”模式并且仅在会话中记忆不会硬编码或泄露。这里还放置了全局的“清空聊天记录”、“清空代码片段”等管理按钮。主区域两列布局左列 - 代码工坊这里是代码的“生产车间”。顶部通过st.radio组件让用户选择核心操作模式“生成代码”、“解释代码”或“通过聊天修正代码”。根据选择下方动态渲染对应的输入表单如生成代码的提示词输入框、解释代码的代码粘贴区。下方是一个可折叠的区域st.expander用于展示所有已生成或管理的代码片段st.code高亮显示每个片段旁有一个复选框用于选择下载。右列 - 对话间这里是代码的“研讨室”。构建一个完整的聊天界面使用st.chat_message根据角色用户/AI渲染气泡st.chat_input在底部提供输入框。所有对话历史从session_state.app_state.chat_history中读取并展示。这个聊天室的核心任务是承接左列“修正代码”模式发起的对话或者让用户自由地与AI讨论任何编码问题。这种布局确保了用户视线可以自然地在“生成/查看代码”和“讨论代码”之间切换模拟了在实际开发中我们在编辑器和浏览器/文档之间切换的工作流。3. 核心功能模块的深度实现3.1 Gemini API客户端的初始化与高效缓存与Gemini API的交互是整个应用的后端引擎。初始化客户端不是简单调用需要考虑安全性和性能。首先API密钥必须由用户提供。我设计了一个initialize_gemini_client(api_key)函数它接收前端传入的密钥使用google.generativeai.configure(api_keyapi_key)进行全局配置。这里一个重要的细节是异常处理如果密钥无效或网络有问题必须用try...except块捕获google.generativeai.types.GoogleAPIError等异常并在前端通过st.error友好地提示用户而不是让整个应用崩溃。其次每次用户交互都创建新的客户端和模型实例是巨大的资源浪费。Streamlit提供了st.cache_resource装饰器它能够跨会话和重跑缓存返回的对象。因此我将获取模型客户端的函数get_gemini_client(model_name)用此装饰器包裹。import streamlit as st import google.generativeai as genai st.cache_resource def get_gemini_client(model_name“gemini-2.0-flash”): “”“返回一个缓存的Gemini模型客户端实例。”“” # 注意api_key需要在调用此函数前通过genai.configure配置好 model genai.GenerativeModel(model_name) return model这样在整个应用生命周期内对于同一个模型名称只会初始化一次模型对象后续调用都是返回缓存实例极大提升了响应速度并减少了API开销。3.2 代码生成与解释功能的Prompt工程AI模型的表现很大程度上取决于我们如何“提问”即Prompt工程。对于不同的功能我设计了差异化的提示模板。代码生成的Prompt相对直接但需要包含足够的约束请用{language}语言编写代码实现以下功能{user_prompt} 要求 1. 代码需要完整可以直接运行。 2. 在代码开头添加清晰的注释说明功能。 3. 输出仅包含代码不要有任何额外的解释或Markdown格式。关键点在于强调“输出仅包含代码”并指定语言。这能有效减少模型返回冗余的说明文本让我们能干净地提取代码块。代码解释的Prompt则侧重于引导模型进行结构化、易懂的说明请详细解释以下{language}代码的功能、逻辑和关键步骤我特意去掉了“分点说明”这类指令因为Gemini模型本身在解释代码时已经具备很好的结构化输出能力过度约束有时反而会让输出变得生硬。实际测试中简单的指令配合高质量的代码输入就能得到非常清晰的逐行或分段解释。3.3 聊天交互中的上下文管理与代码提取“通过聊天修正代码”是功能最复杂也最体现价值的一环。这里最大的挑战是上下文管理。聊天是连续的但AI模型本身并不天然记住之前的对话和展示过的代码。我的实现策略是当用户选择“Correct Code (via Chat)”模式时应用会尝试将当前选中的或最新生成的代码片段作为系统上下文的一部分在发送给AI的请求中携带。具体来说在构建发送给send_gemini_message函数的最终Prompt时我会预置一段话“用户正在讨论以下代码[代码内容]。请基于此进行对话和修正。”更棘手的是如何从AI的回复中自动提取修正后的代码。AI在聊天中返回的通常是包含自然语言和代码块用包裹的Markdown文本。我编写了一个辅助函数extract_code_from_response(response_text)它使用正则表达式如r“{3}(?:\w)?\n([\s\S]*?){3}“来匹配并提取所有代码块。一旦提取成功就会自动创建一个新的CodeSnippet对象并添加到app_state.code_snippets列表中同时在前端给出提示“检测到新代码已添加到管理列表”。这样用户与AI讨论产生的成果就能被无缝捕获和管理。实操心得正则表达式提取代码块并非百分百可靠特别是当AI的回复格式不规则时。因此这个功能被设计为“尽力而为”。在UI上我仍然保留了手动复制代码的选项并鼓励用户在AI返回重要代码时可以手动点击“添加到片段”按钮。这是一种“自动捕获手动兜底”的稳健策略。3.4 代码片段的管理与批量下载机制管理多个代码片段并允许选择性下载是这个工具从“玩具”迈向“实用”的关键一步。每个CodeSnippet对象在创建时都会生成一个唯一的ID我用uuid.uuid4().hex。在UI上用一个循环遍历app_state.code_snippets为每个片段渲染一个st.expander标题显示文件名和语言内容区域用st.code高亮显示代码。每个expander旁边都有一个复选框st.checkbox其key与片段的ID绑定值存储在app_state.selected_snippet_ids一个Set集合中。当用户点击“下载”按钮时后端逻辑会遍历selected_snippet_ids找到对应的CodeSnippet对象。在内存中使用zipfile.ZipFile创建一个ZIP压缩包。将每个代码片段的内容以其filename确保以.py、.js等结尾写入到ZIP包中的独立文件。使用Streamlit的st.download_button将ZIP文件的二进制数据提供下载。这个机制使得用户在一次会话中产生的所有代码成果都可以被系统地归档和带走非常适合用于保存学习笔记或构建小型代码示例库。4. 从零开始的完整部署与实操指南4.1 本地开发环境搭建详解假设你从零开始想在自己的机器上运行或修改这个项目。第一步获取代码。如果你使用Git可以直接克隆仓库git clone https://github.com/djmahe4/CursorAISim.git。如果只是下载请确保拿到code.py和requirements.txt这两个核心文件。第二步创建并激活虚拟环境。这是Python项目的最佳实践能隔离依赖。在项目根目录下执行# 创建虚拟环境文件夹名为venv python -m venv venv # 激活虚拟环境 # macOS/Linux: source venv/bin/activate # Windows: venv\Scripts\activate激活后你的命令行提示符前通常会显示(venv)表示已进入虚拟环境。第三步安装依赖。确保在虚拟环境激活状态下安装requirements.txt中列出的所有包pip install -r requirements.txtrequirements.txt通常包含streamlit1.28.0 google-generativeai0.3.0 pydantic2.0.0 python-dotenv1.0.0 # 可选用于从.env文件加载密钥pydantic用于数据验证google-generativeai是Gemini官方SDKpython-dotenv可用于更安全地管理API密钥将密钥放在项目根目录的.env文件中而不是代码里。第四步配置Gemini API密钥。前往 Google AI Studio 登录你的Google账号创建一个API密钥。首次运行streamlit run code.py后在应用左侧边栏的输入框中粘贴此密钥即可。切勿将密钥直接写入code.py文件或提交到公开仓库。4.2 核心交互流程的逐步演练环境准备好后启动应用streamlit run code.py。浏览器会自动打开本地地址通常是http://localhost:8501。场景一快速生成一个Python数据可视化片段。在左侧边栏输入有效的Gemini API密钥。在主区域左列选择操作模式为“Generate Code”。在“Your Prompt”输入框写下“用matplotlib画一个正弦波和余弦波的对比图要求添加图例和网格”。在“Filename”输入“sin_cos_plot.py”在“Language”选择“python”。点击“Generate Code”按钮。稍等片刻生成的Python代码就会出现在下方的“Generated/Managed Code Snippets”区域。点击片段标题可以展开查看高亮显示的完整代码。场景二理解一段陌生的代码。将操作模式切换为“Explain Code”。将你想理解的代码比如一段复杂的正则表达式或递归函数粘贴到大的文本区域中。点击“Explain Code”按钮。AI生成的解释会直接显示在按钮下方通常会对代码的功能、输入输出、关键行逻辑进行清晰的阐述。场景三与AI结对编程优化代码。首先用“Generate Code”模式生成一段基础代码比如一个简单的冒泡排序函数。将操作模式切换到“Correct Code (via Chat)”。此时最新生成的那个代码片段会自动成为聊天上下文的背景应用会提示“当前正在讨论的代码片段…”。在右侧聊天框输入“这个排序函数的时间复杂度是多少能否优化成更快的算法”AI会先分析当前代码的复杂度O(n^2)然后可能会直接给出一个快速排序或归并排序的代码示例。如果回复中包含用包裹的代码块应用会自动将其提取并作为一个新的代码片段添加到左侧管理区。你可以继续追问“这个新代码的空间复杂度呢” 聊天会基于整个对话历史继续进行。场景四打包带走你的工作成果。在左侧的代码管理区勾选你想要的代码片段前的复选框。然后点击下方的“Download Selected Code Snippets (.zip)”按钮浏览器就会下载一个包含所有选中代码文件的ZIP压缩包。4.3 模型切换与高级参数调优项目默认使用gemini-2.0-flash模型它在速度和成本间取得了良好平衡。如果你想尝试更强大的模型如gemini-2.0-pro用于更复杂的逻辑推理或最新的预览版模型只需修改code.py中初始化模型的一行代码。找到类似下面的行通常在get_gemini_client函数内model genai.GenerativeModel(‘gemini-2.0-flash’)将其中的模型名称字符串替换即可例如model genai.GenerativeModel(‘gemini-2.0-pro’) # 或使用某个预览版 model genai.GenerativeModel(‘gemini-2.5-flash-preview-04-17’)此外GenerativeModel的generation_config参数允许你精细控制AI的创造行为。你可以在初始化时传入一个配置字典model genai.GenerativeModel( ‘gemini-2.0-flash’, generation_config{ “temperature”: 0.7, # 控制随机性0更确定1更有创意 “top_p”: 0.9, “top_k”: 40, “max_output_tokens”: 2048, # 限制响应长度 } )对于代码生成任务我通常将temperature设置在0.2到0.5之间以获得更确定、更符合惯例的代码对于头脑风暴或寻找多种解决方案可以调高到0.7以上。5. 常见问题排查与性能优化经验5.1 启动与运行时的典型报错处理在实际使用中你可能会遇到以下问题1.ModuleNotFoundError: No module named ‘google’或‘streamlit’问题这说明依赖包没有正确安装。解决首先确认虚拟环境是否已激活命令行前有(venv)。然后在项目根目录下重新执行pip install -r requirements.txt。如果网络问题导致安装失败可以尝试使用国内镜像源如pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple。2.google.generativeai.types.GoogleAPIError: 400 ... API key not valid.问题最常见的错误API密钥无效或未设置。解决a) 检查在Google AI Studio创建的密钥是否复制完整前后有无空格。b) 确认已在Streamlit应用的侧边栏输入框中正确粘贴了密钥。c) 确保你的Google Cloud项目已启用Gemini API并且该API密钥未被禁用或限制。3. 应用界面卡顿特别是聊天历史很长时问题Streamlit在每次交互后重跑整个脚本如果session_state中存储的数据量很大比如很长的聊天历史渲染会变慢。解决a) 定期使用侧边栏的“Clear Chat”按钮清理历史。b) 从代码层面可以考虑对非常长的聊天历史进行分页或只保留最近N条消息在session_state中将更早的历史记录到文件或数据库。c) 确保没有在每次重跑时进行不必要的昂贵计算充分利用st.cache_data和st.cache_resource。4. 代码提取功能未能正确识别AI回复中的代码块问题AI的回复格式可能多变正则表达式可能匹配失败。解决首先检查AI的原始回复内容可以在后端打印日志。如果代码块使用了非标准的标记如只有单个反引号需要调整正则表达式。更稳健的方法是结合使用正则和简单的字符串查找如查找“”的索引。此外在UI上提供明确的反馈告知用户“未检测到可提取的代码块请手动复制”并保留一个“手动添加当前AI回复为代码片段”的按钮作为备用路径。5.2 安全性、成本与性能的最佳实践API密钥安全这是重中之重。绝对不要将API密钥硬编码在code.py文件中或提交到Git等版本控制系统。最佳实践是使用环境变量在运行Streamlit前在终端设置export GEMINI_API_KEY‘your_key_here’Linux/macOS或set GEMINI_API_KEYyour_key_hereWindows然后在代码中用os.getenv(‘GEMINI_API_KEY’)读取。使用.env文件安装python-dotenv在项目根目录创建.env文件写入GEMINI_API_KEY‘your_key_here’在code.py开头加载dotenv.load_dotenv()。务必在.gitignore文件中添加.env防止其被意外提交。成本控制Gemini API按每千字符的输入和输出收费。虽然gemini-2.0-flash成本很低但长时间、高频率使用仍需关注。策略在开发调试阶段可以在代码中设置max_output_tokens限制避免生成过于冗长的回复。对于解释代码功能通常不需要非常长的输出。监控定期在Google AI Studio的API使用仪表盘中查看消耗情况设置预算提醒。响应速度优化缓存一切可缓存的除了用st.cache_resource缓存模型客户端对于一些不常变化的配置或静态数据也可以使用st.cache_data。精简Prompt在满足需求的前提下让发送给AI的Prompt尽可能简洁明确减少不必要的上下文这能降低输入token数并可能加快AI处理速度。异步处理高级对于耗时的AI调用可以考虑使用异步函数async/await配合Streamlit的st.rerun或实验性功能防止界面在等待AI响应时完全卡住。不过这需要更复杂的错误处理和状态管理。5.3 项目扩展与自定义开发方向这个基础框架有很大的扩展潜力你可以根据自己的需求添加功能1. 多模型支持与路由可以创建一个模型选择器让用户在前端选择使用Gemini、OpenAI的GPT需集成openai库甚至是本地的开源模型通过Ollama等工具。后端设计一个统一的AIClient接口不同的模型实现该接口再根据用户选择路由请求。2. 会话历史持久化目前聊天历史和代码片段只在浏览器会话期间存在刷新页面就没了。可以集成一个轻量级数据库如SQLite或直接读写本地JSON文件。在AppState初始化时尝试从本地加载历史在每次更新时自动保存。需要处理好并发写入的问题对于单用户Streamlit应用通常问题不大。3. 代码风格与质量检查在生成或接收代码后可以调用本地的代码格式化工具如blackfor Python,prettierfor JS进行自动格式化。更进一步可以集成简单的静态分析如pylint或安全扫描让AI助手不仅能写代码还能初步评估代码质量。4. 项目级代码管理当前是片段Snippet级别的管理。可以扩展为“项目”Project概念一个项目包含多个相关文件如main.py,utils.py,requirements.txt并支持整个项目的打包下载和版本快照。5. 部署到云端想让别人也能用可以轻松部署到Streamlit Community Cloud、Hugging Face Spaces或任何支持Python的云服务器如Railway, Render。部署时记得将API密钥设置为云平台的环境变量而不是写在代码里。Streamlit Community Cloud的部署流程非常顺畅关联GitHub仓库后几乎可以一键完成。这个项目就像一颗种子核心的“交互-生成-管理”循环已经跑通。围绕它你可以根据自己的具体工作流和痛点添加各种功能把它打磨成最适合你个人或团队使用的AI编程小助手。

终极Windows热键侦探：3分钟定位键盘快捷键冲突的完整指南

终极Windows热键侦探：3分钟定位键盘快捷键冲突的完整指南【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective 你是否…...

2026/5/10 10:58:36 阅读更多 →

一站式AI服务分发平台搭建指南：从零部署到商业化运营

1. 项目概述：一个功能聚合的AI服务分发平台如果你手头有几个ChatGPT Plus账号，或者搞到了一些Claude、Gemini的API密钥，想分享给朋友或者小范围用户使用，同时还想做个简单的付费墙来覆盖成本甚至赚点零花钱，那你大概率…...

2026/5/10 10:55:34 阅读更多 →

ARM926E嵌入式系统优化：功耗建模与缓存配置实战

1. 实时系统优化的核心挑战与解决思路在移动设备和嵌入式系统设计中，我们常常面临一个"不可能三角"——高性能、低功耗和低成本这三个目标往往相互制约。作为一名长期从事嵌入式系统开发的工程师，我见过太多项目因为早期架构决策失误&#xff…...

2026/5/10 10:55:34 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/10 0:01:34 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/10 0:10:18 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/10 0:14:33 阅读更多 →