Prompt Engineer

All authors

Looking Inward: Language Models Can Learn About Themselves by Introspection (AI summary)

Felix J Binder, James Chua, Tomek Korbak, Henry Sleight, John Hughes, Robert Long, Ethan Perez, Miles Turpin, Owain Evans

• October 25th, 2024

Read more

Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence (AI summary)

Shangbin Feng, Zifeng Wang, Yike Wang, Sayna Ebrahimi, Hamid Palangi, Lesly Miculicich, Achin Kulshrestha, Nathalie Rauschmayr, Yejin Choi, Yulia Tsvetkov, Chen-Yu Lee, Tomas Pfister

• October 24th, 2024

Read more

Thinking LLMs: General Instruction Following with Thought Generation

Tianhao Wu, Janice Lan, Weizhe Yuan, Jiantao Jiao, Jason Weston, Sainbayar Sukhbaatar

• October 23rd, 2024

Read more

I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy (AI summary)

Gian Maria Campedelli, Nicolò Penzo, Massimo Stefan, Roberto Dessì, Marco Guerini, Bruno Lepri, Jacopo Staiano

• October 23rd, 2024

Read more

Addition is All You Need for Energy-efficient Language Models (AI summary)

Hongyin Luo, Wei Sun

• October 23rd, 2024

Read more

ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery (AI summary)

Ziru Chen, Shijie Chen, Yuting Ning, Qianheng Zhang, Boshi Wang, Botao Yu, Yifei Li, Zeyi Liao, Chen Wei, Zitong Lu, Vishal Dey, Mingyi Xue, Frazier N. Baker, Benjamin Burns, Daniel Adu-Ampratwum, Xuhui Huang, Xia Ning, Song Gao, Yu Su, Huan Sun

• October 22nd, 2024

Read more

Rejection Sampling IMLE: Designing Priors for Better Few-Shot Image Synthesis (AI summary)

Chirag Vashist, Shichong Peng, Ke Li

• October 21st, 2024

Read more

Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System (AI summary)

Weize Chen, Jiarui Yuan, Chen Qian, Cheng Yang, Zhiyuan Liu, Maosong Sun

• October 21st, 2024

Read more

Evaluation of OpenAI o1: Opportunities and Challenges of AGI (AI summary)

Tianyang Zhong, Zhengliang Liu, Yi Pan, Yutong Zhang, Yifan Zhou, Shizhe Liang, Zihao Wu, Yanjun Lyu, Peng Shu, Xiaowei Yu, Chao Cao, Hanqi Jiang, Hanxu Chen, Yiwei Li, Junhao Chen, Huawen Hu, Yihen Liu, Huaqin Zhao, Shaochen Xu, Haixing Dai, Lin Zhao, Ruidong Zhang, Wei Zhao, Zhenyuan Yang, Jingyuan Chen, Peilong Wang, Wei Ruan, Hui Wang, Huan Zhao, Jing Zhang, Yiming Ren, Shihuan Qin, Tong Chen, Jiaxi Li, Arif Hassan Zidan, Afrar Jahin, Minheng Chen, Sichen Xia, Jason Holmes, Yan Zhuang, Jiaqi Wang, Bochen Xu, Weiran Xia, Jichao Yu, Kaibo Tang, Yaxuan Yang, Bolun Sun, Tao Yang, Guoyu Lu, Xianqiao Wang, Lilong Chai, He Li, Jin Lu, Lichao Sun, Xin Zhang, Bao Ge, Xintao Hu, Lian Zhang, Hua Zhou, Lu Zhang, Shu Zhang, Ninghao Liu, Bei Jiang, Linglong Kong, Zhen Xiang, Yudan Ren, Jun Liu, Xi Jiang, Yu Bao, Wei Zhang, Xiang Li, Gang Li, Wei Liu, Dinggang Shen, Andrea Sikora, Xiaoming Zhai, Dajiang Zhu, Tianming Liu

• October 20th, 2024

Read more

GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models (AI summary)

Iman Mirzadeh, Keivan Alizadeh, Hooman Shahrokhi, Oncel Tuzel, Samy Bengio, Mehrdad Farajtabar

• October 20th, 2024

Read more

2/55

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55

ML and AI papers

Prompt Engineer

Looking Inward: Language Models Can Learn About Themselves by Introspection (AI summary)

Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence (AI summary)

Thinking LLMs: General Instruction Following with Thought Generation

I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy (AI summary)

Addition is All You Need for Energy-efficient Language Models (AI summary)

ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery (AI summary)

Rejection Sampling IMLE: Designing Priors for Better Few-Shot Image Synthesis (AI summary)

Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System (AI summary)

Evaluation of OpenAI o1: Opportunities and Challenges of AGI (AI summary)

GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models (AI summary)