sillytavern吧 关注:3,014贴子:4,900
  • 18回复贴,共1
求助

Gemini越聊越笨怎么办

只看楼主收藏回复

目前聊了十几万字,预设用的mygo,加了思维链,从七八万字左右加载速度越来越慢,输出质量也开始降低,请问各位大佬有无什么靠谱办法,还是说这就是通病
api是Gemini2.0flash


IP属地:广东来自Android客户端1楼2025-01-01 15:48回复
    已经自己摸索着解决,这里发一下方案,以供其他遇到一样问题的朋友参考:(非计算机专业可能有错误欢迎指正)
    我的配置:
    api:Gemini2.0flash/Gemini1.5flash
    1.5在长文本读取方面比2.0快一些(我的体验感受,如果2.0实在太卡就换1.5)
    预设:mygo(角色扮演cot)
    解决方法:用了八零牌详细总结世界书,指路dc社区,按照教程总结一遍丢场景覆盖即可,或者自行总结放世界书都行,然后hide一下之前楼层(隐藏代码:/hide xx-xx 显示代码:/unhide xx-xx)留一个备用的聊天楼或者新开就可以继续了
    还看到一个解决方法是删去除cot的正则,如图,但是感觉暴露cot有点丑陋,没试


    IP属地:广东来自Android客户端2楼2025-01-02 21:49
    收起回复
      有办法可以关闭思维链吗


      IP属地:广西3楼2025-01-16 11:21
      收起回复
        大佬,能不能分享一下mygo的卡,十分感谢


        IP属地:江苏4楼2025-01-18 21:56
        收起回复
          思维链是不是如果不显示,相当于ai没有做过这些考虑


          IP属地:浙江来自Android客户端5楼2025-01-19 11:13
          收起回复
            您好,我想请问一下新人要怎么进社区呢?目前还可以进吗?可以求一个discord邀请链接吗?


            IP属地:澳大利亚6楼2025-01-20 22:44
            收起回复
              LZ这种情况就是典型的文案长度超过了AI可记忆上下文长度,这种情况使用外部付费API的时候更明显,如果不调整上下文每小时我最多干出去50W token而且直接撞了限流墙,解决的办法只能是调低上下文记忆长度然后及时总结


              IP属地:北京7楼2025-02-18 11:23
              收起回复