本周的重点是实验 2,其中涉及通过创建拉取请求 (pr) 为我不拥有的存储库做出贡献。我首先选择一个同学的存储库来进行工作。鉴于 javascript 是我的主要编程语言,我选择了基于 javascript 的存储库来简化我的工作流程。虽然我愿意探索其他语言,但我选择 js 项目节省了时间,让我可以更舒适地工作。事实证明,这个决定是有益的,因为我选择的存储库存在一些问题,无法在本地运行。这让我在理解代码库和应对挑战方面取得了先机。以下是该过程的详细分解:
在审查了几个项目后,我决定为一个旨在将网页内容转换为 markdown 文件的存储库做出贡献。将存储库分叉并克隆到本地计算机后,我按照自述文件中概述的设置说明进行操作。然而,我的同学似乎使用的是 macos,它利用 ln 命令进行符号链接。由于我在 windows 上,我必须用 npm link 命令替换此步骤。
在调查设置时,我注意到 package.json 文件缺少 start 和 bin 属性,这是设置符号链接所必需的。我添加了这些条目,并建议我的同学在文档中包含针对 windows 用户的说明。更多详情
应用程序运行后,我遇到了其他问题。第一个问题涉及将用户输入的用于配置 groq 的 api 的 api 密钥保存在 .env 文件中。我编写了几行代码来处理 api 密钥存储。另一个问题是由于处理输出文件的代码范围不正确导致的,这导致应用程序无法按预期生成输出。
在实现本实验的主要功能(跟踪每个请求/响应的令牌使用情况)之前,我解决了这两个初始问题。对于每个问题,我创建了一个单独的分支并提交了三个不同的拉取请求。
for await (const chunk of chatcompletion) { process.stdout.write(chunk.choices[0]?.delta?.content || ""); // process.stdout.write(chunk.choices[0]?.delta?.content || ""); response += chunk.choices[0]?.delta?.content || ""; console.log(chunk); if (chunk.x_groq?.usage) { prompttokens = chunk.x_groq?.usage?.prompt_tokens; responsetokens = chunk.x_groq?.usage?.completion_tokens; } }
关于我自己的存储库,一位名叫 hyujin shin 的同学在 lab 1 期间为其做出了贡献。最初,我注意到他似乎正在开发我的代码库的过时版本,因为此后我重新组织了结构以提高清晰度和效率。他再次遇到了与设置符号链接相关的问题,我在问题 #7 中提供了指导,建议他在按照使用部分中的符号链接设置说明之前提取最新版本。
我的代码中的另一个问题与输出文件处理有关,该问题源于选项标志与其在代码中的调用之间的不匹配,从而阻止了正确的文件处理。我在第 8 期中通过视觉辅助工具提供了详细的回复。
对于本实验的主要功能——跟踪代币使用情况,hyujin 高效地实现了它,而无需对代码库进行重大更改。由于我已经正确初始化了 groq,他只需要从 chatcompletion 响应中提取使用数据即可:
javascript Copy code // Retrieve Token Usage from Response const promptToken = chatCompletion.usage.prompt_tokens; const completionToken = chatCompletion.usage.completion_tokens; const totalToken = chatCompletion.usage.total_tokens; const tokenInfo = { promptToken, completionToken, totalToken };
在审查了他添加的功能后,我合并了 pr 并进行了测试,确认一切都按预期工作。
这个实验室提供了从 llm (groq) 中提取令牌使用情况的宝贵见解,我之前通过计算单词数来计算出的令牌使用情况并不准确。更重要的是,这次经历凸显了协作的重要性——创建拉取请求、接收代码审查以及合并其他人的贡献。