gbemike

gbemike_o gbemike

Achievements

every_eval_ever every_eval_ever Public

Forked from evaleval/every_eval_ever

Every Eval Ever is a shared schema and crowdsourced eval database. It defines a standardized metadata format for storing AI evaluation results — from leaderboard scrapes and research papers to loca…

Python
Recruitment-Collusion Recruitment-Collusion Public

Framework to run experiments to study Recruitment Based Collusion in Multi-agent Oversight Systems

Python
sarahlz01/GrokResearch sarahlz01/GrokResearch Public

Python 3 1
nba_pipeline nba_pipeline Public

Dagster pipeline for ingesting NBA player data

Python 7