KevinSimback

期間 1.3 年

ピーク時のランク 0

現在、コンテンツはありません

KevinSimback

10時間前

野心的なAI研究者にとって、次のような本格的なチャンスがあります：
- Openclaw、Hermes、その他の「クロー」などのエージェントハーネスをテストする評価フレームワークを作成する
- 異なるツールや設定に評価を拡張し、さまざまな構成でのパフォーマンスの変化を把握する
- ローカルとAPIを含むさまざまなモデル間で堅牢な評価を実行する
- ベンチマークを行い結果を公開し、エージェントやモデルの進化に合わせて継続的に更新する
この機会は、客観的なエージェントベンチマークのための「唯一の信頼できる情報源」になることです
もしかすると、すでに誰かがこれを行っているのかもしれませんし、私が知らないだけかもしれません。単なる一時的な比較ではなく、真の標準テストと評価を行い、結果を比較できる状態を作ることが重要です

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

03-27 13:49

私はお金よりも、あなたをクソみたいに扱うスキルの方が欲しい

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

03-26 12:33

ここ数日、「修正した」と言うモデルの例が増えているのに、実際には何も修正されていないのを見かけました
他にこれを見ている人はいますか？
直感的には、全体的に劣化が進んでいるように感じます

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

KevinSimback

03-25 18:56

ローカルでモデルを実行する理由は何か?
通常、2つの主な理由があります - プライバシーとコスト
コスト面について例を挙げて探ってみましょう。計算方法を見てみます
@karpathy のようにAutoresearchループを一晩実行したいとします
H100にアクセスできる場合、Opus-4.6を使用してAPIコストが$10-25の範囲で、一晩に100件の実験を実行できます
しかし、ほとんどの人はH100にアクセスできる幸運に恵まれていません
MacBookで同じ$10-25で100件のAutoresearch実験を実行できますが、比較対象にはなりません
H100は同じ時間枠でトレーニングステップを50-100倍多く完了します
したがって、同じ数のトレーニングステップを再現したい場合、APIコストで$1000以上を支払う可能性があり、もちろん一晩より長くかかります
H100をレンタルしてはるかに安価に同じ仕事をより速く完了できるため、これはあまり賢明ではありません
しかし、これはローカルでモデルを実行する理由の全体像を描き始めます - それは、ほとんどの人にとってコスト禁止事項になるような実験を可能にします
競技場を平準化し始めます
古いパソコンでQwen3.5 9Bを実行していますが、APIコストで費用負担する場合は実行しない実験に取り組む意味があります
これは大きなアンロックであ

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

03-24 16:24

AIに関する個人的な考察
大学でCS（コンピュータサイエンス）を学び始めたが、私は決して優秀なコーダーではなかった
3年生の時にコーポレートファイナンスのクラスを受講し、優秀な成績を収めた。コーディングよりもファイナンスの方がずっと得意だったので、専攻を変更した
しかし本当にコーディングができる人たちに対して、ずっと劣等感を抱いていた
彼らは私と比べて何を構築する際にも圧倒的に優れており、私は技術的な依存性の点で彼らに頼らざるを得なかった
だから私はExcelのモデルとパワーポイントを自分の強みにすることに専念した
ゴールドマンサックスでコンサルタントとして働いていた時、本当のファイナンス系クォンツ（金融工学者）に出会った
彼らの大多数はコーディングができ、かつファイナンスの知識も持っていた
再び劣等感を感じた。私は数学は得意だったが、これらのクォンツは私をはるかに上回っていた
私はキャリアの大半をこの劣等感を抱きながら過ごし、ジェネラリストオペレーターとしてのスキルを磨いてきた
コーダーやクォンツは今でも私を圧倒することができるが、リソースを価値に組み立て、それを独自の価値あるスキルセットと見なすことができるようになった
しかし最近のAIの登場により、コーダーやクォンツに対するキャリアの長期的な劣等感から解放されたような気がしている
Claude Codeを使えば、実際にコーディ

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

03-23 12:54

ストラテジストのように考え、デベロッパーのように働く -> それが新しいモデルだ

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

KevinSimback

03-21 11:50

Claude Maxプランはビュッフェ形式の食べ放題みたいなものです
もう満腹ですが、それでもトークンをもう一皿いただきましょう

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

03-19 14:29

「ねえケビン、ずっとopenclawとエージェントのことをやってきたけど、生産性は上がった？」
100％上がったけど、その一方で集中力も高まっている。
だから、エージェントに仕事を任せて自分はマルガリータを飲みながらリラックスする方法だと思っているなら、それは違う。
人によってはそうかもしれないけど、僕の自然な傾向は、同じ時間内にもっと多くのことをやることだ。
それは両刃の剣だ。

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

03-19 11:03

AIエージェントはこの世代の「インターネット時代」である
スタートアップにとっては、製品がどのように構築され、仕事がどのように進められるかを再考する機会である
エンタープライズにとっては、競争ポジションを変える経営モデルの再設計である
投資家にとっては、完全に新しいアドレッサブル市場である

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

KevinSimback

03-18 19:12

分析へのリンク:

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

03-16 20:20

Nvidiaのジェンセン最高経営責任者は本日、GTCカンファレンスで次のように述べました：「世界中のすべての企業は、OpenClaw戦略、つまりエージェント戦略を持つ必要があります」そして、OpenClawを基盤とし、セキュリティとエンタープライズツールを強化したエンタープライズ対応版のNemoClawを発表しました。

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

03-14 13:14

生産性最大化の設定
あああ、私は生産的になっている！

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

03-13 13:12

以下は、最近最も関心を持っている3つの分野です。これらの領域で活動している方との交流や連絡をお待ちしています。
1. エージェント導入
AIエージェントは現在転換点にあり、探索すべきことがまだたくさんあると考えています。これはまだ初期段階です。
エージェントが大規模に増殖するという確信度は非常に高いですが、その結果として価値がどのように分配・獲得されるかについては(現在)確信度は非常に低いです。
2. AI インフラ
あまり話題に出しませんが、舞台裏ではこの分野で最もエキサイティングなプロジェクトの1つと協力しており、今後の発表をお楽しみに
#1を信じるなら、今後発生するすべての計算需要にどのようにサービスを提供するかについて深く考える必要があります。これは、エネルギーとインフラレイヤーでのイノベーションが必要であることを意味します。
3. 資産のトークン化
金融資産のほとんどがトークン化されるというラリー・フィンク氏の見方を支持しています。問題は、どのように、そしていつ行われるかということです。
この分野に関わるいくつかのプロジェクトと協力しており、紙と保管機関を通じて現在得られる投資家の権利と保護を真にオンチェーン提供し、さらにこれらの資産がトークン化されたときに実行可能な追加のメリットを提供する新しい形式の資産所有に期待しています。
これら3つすべてについて詳しく掘り下げてお

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

03-13 10:41

「エージェント経済学」は、将来のエージェントがお金を稼ぐ方法について予測し、語る人々の新興分野である。
私の見解は、まだわかっていないということだ。実験を続けることで、徐々に答えが見えてくるだろう。
私の根本的な疑問は、もしエージェントの構築と運用が安価であれば、なぜ彼らは互いに値下げを続け、提供するさまざまなサービスの価格が推論コスト＋わずかなマージン程度になるまで競争をやめないのかということである。
これこそが私にとってのエージェント経済学の決定的な問いであり、この問いに対して十分な答えを持っていない者は、このテーマについて深く考えきれていないと言える。

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

03-11 22:13

OpenClaw / エージェントプラットフォームで私が見ている4つの最良のユースケースは次のとおりです：
1. パーソナルアシスタント / チーフ・オブ・スタッフ
本来の目的はこれであり、あなたの個人用ジャービスとして、個人、プロフェッショナル、またはその両方に等しく利用できます
エージェントを使って何もしなくても、これだけで十分価値があります
2. コーディングアシスタント / コーディングチーム
エージェントは物を作るのに非常に効果的で、複数のスペシャリストエージェントがチームで働くと、かなり魔法のようです
しかし、基本的にはClaude Code / Codexとツール/MCPsを使って同じことができます
つまり、ここでのハードルは、持続的なエージェントを通じてよりアクセスしやすくすることに過ぎません。高度な開発者で良いAIツールを持っている場合、それほど価値があるわけではないかもしれません
3. マーケティングとコンテンツ
デジタルコンテンツを作成し、多くのオンラインアカウントを管理している場合、良いエージェント設定は大きな生産性向上につながります
すべてのワークフローを自動化し、あなたがクリエイティブでいるのを助けながら、重い負担を軽減します
これが「OpenClawインフルエンサー」層がこれに熱中している大きな理由であり、彼らにとっては話題のコンテンツと、はるかに多く

原文表示