Lazy loaded image
🔎QMath 功能增强
字数 189阅读时长 1 分钟
2025-3-6
2025-3-6
password
comment
type
status
date
slug
summary
tags
category
icon
AI custom autofill
remaining_eval.py
gintmr
remaining_eval.py
gintmr
apply_RL_prompt.py
gintmr
remaing.sh
gintmr
long_short_remaining_RL.sh
gintmr
核心代码以及运行脚本👆

主要改动:

功能

涉及到两个环境变量:tip和stage
tip包括:
  • Ahead:
    • \n<remaining>[{budget} token]</remaining>\n加入进问题的末尾
  • remaining:
    • 包含Ahead功能,且同时在推理时递归地插入倒计时budget token
  • prompt-based:
    • 在问题末尾加上基于自然语言的prompt提示,例如You should finish thinking with in {budget} tokens.\n
  • default:
    • 对问题不做处理
stage包括:
  • 1:一次性输出完成
  • 2:在第一轮输出完成后,在文本末尾处添加</think>\n\n**Final Answer**\n\\boxed

template

Ⅰ增加了deepseek3的提示模板
  • 路径:/data05/wuxinrui/Qwen2.5-Math/evaluation/utils.py
Ⅱ同时在终止符列表中加入了deepseek3模板对应的终止符
  • 路径:/data05/wuxinrui/Qwen2.5-Math/evaluation/remaining_eval.py
 
上一篇
两JSON指定键值替换
下一篇
COCO格式数据集合并脚本

评论
Loading...