ML and AI papers for prompt engineers

Looking Inward: Language Models Can Learn About Themselves by Introspection (AI summary)

Felix J Binder, James Chua, Tomek Korbak, Henry Sleight, John Hughes, Robert Long, Ethan Perez, Miles Turpin, Owain Evans

Prompt Engineer • October 25th, 2024

Read more

Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence (AI summary)

Shangbin Feng, Zifeng Wang, Yike Wang, Sayna Ebrahimi, Hamid Palangi, Lesly Miculicich, Achin Kulshrestha, Nathalie Rauschmayr, Yejin Choi, Yulia Tsvetkov, Chen-Yu Lee, Tomas Pfister

Prompt Engineer • October 24th, 2024

Read more

Thinking LLMs: General Instruction Following with Thought Generation

Tianhao Wu, Janice Lan, Weizhe Yuan, Jiantao Jiao, Jason Weston, Sainbayar Sukhbaatar

Prompt Engineer • October 23rd, 2024

Read more

I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy (AI summary)

Gian Maria Campedelli, Nicolò Penzo, Massimo Stefan, Roberto Dessì, Marco Guerini, Bruno Lepri, Jacopo Staiano

Prompt Engineer • October 23rd, 2024

Read more

Addition is All You Need for Energy-efficient Language Models (AI summary)

Hongyin Luo, Wei Sun

Prompt Engineer • October 23rd, 2024

Read more

ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery (AI summary)

Ziru Chen, Shijie Chen, Yuting Ning, Qianheng Zhang, Boshi Wang, Botao Yu, Yifei Li, Zeyi Liao, Chen Wei, Zitong Lu, Vishal Dey, Mingyi Xue, Frazier N. Baker, Benjamin Burns, Daniel Adu-Ampratwum, Xuhui Huang, Xia Ning, Song Gao, Yu Su, Huan Sun

Prompt Engineer • October 22nd, 2024

Read more

Rejection Sampling IMLE: Designing Priors for Better Few-Shot Image Synthesis (AI summary)

Chirag Vashist, Shichong Peng, Ke Li

Prompt Engineer • October 21st, 2024

Read more

Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System (AI summary)

Weize Chen, Jiarui Yuan, Chen Qian, Cheng Yang, Zhiyuan Liu, Maosong Sun

Prompt Engineer • October 21st, 2024

Read more

Evaluation of OpenAI o1: Opportunities and Challenges of AGI (AI summary)

Tianyang Zhong, Zhengliang Liu, Yi Pan, Yutong Zhang, Yifan Zhou, Shizhe Liang, Zihao Wu, Yanjun Lyu, Peng Shu, Xiaowei Yu, Chao Cao, Hanqi Jiang, Hanxu Chen, Yiwei Li, Junhao Chen, Huawen Hu, Yihen Liu, Huaqin Zhao, Shaochen Xu, Haixing Dai, Lin Zhao, Ruidong Zhang, Wei Zhao, Zhenyuan Yang, Jingyuan Chen, Peilong Wang, Wei Ruan, Hui Wang, Huan Zhao, Jing Zhang, Yiming Ren, Shihuan Qin, Tong Chen, Jiaxi Li, Arif Hassan Zidan, Afrar Jahin, Minheng Chen, Sichen Xia, Jason Holmes, Yan Zhuang, Jiaqi Wang, Bochen Xu, Weiran Xia, Jichao Yu, Kaibo Tang, Yaxuan Yang, Bolun Sun, Tao Yang, Guoyu Lu, Xianqiao Wang, Lilong Chai, He Li, Jin Lu, Lichao Sun, Xin Zhang, Bao Ge, Xintao Hu, Lian Zhang, Hua Zhou, Lu Zhang, Shu Zhang, Ninghao Liu, Bei Jiang, Linglong Kong, Zhen Xiang, Yudan Ren, Jun Liu, Xi Jiang, Yu Bao, Wei Zhang, Xiang Li, Gang Li, Wei Liu, Dinggang Shen, Andrea Sikora, Xiaoming Zhai, Dajiang Zhu, Tianming Liu

Prompt Engineer • October 20th, 2024

Read more

GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models (AI summary)

Iman Mirzadeh, Keivan Alizadeh, Hooman Shahrokhi, Oncel Tuzel, Samy Bengio, Mehrdad Farajtabar

Prompt Engineer • October 20th, 2024

Read more