1.トークンダガー:最速トークナイザー(TokenDagger – A tokenizer faster than OpenAI's Tiktoken)
TokenDaggerは、Llama 3やGPT-3のようなモデルでテキストを処理するために使用されるOpenAIのTiktokenを置き換える新しいツールです。C++ 17で構築されており、Pythonにも対応しています。TokenDaggerの主な目的は、同じ語彙とトークンルールを維持しながら、速度を向上させることです。
開発者は、大規模言語モデル(LLM)について学ぶために、トークナイザーをゼロから再構築しています。元のTiktokenは正規表現のマッチングに多くの時間を費やしていることがわかったため、より高速な正規表現エンジンを使用し、特別なトークンに対しては正規表現を避けるようにプロセスを簡素化しました。
ベンチマークテストの結果、TokenDaggerは単一スレッドでのコードサンプルのトークン化において4倍速く、1GBのテキストファイルの処理においては2倍から3倍速いことが示されています。
2.ドンキーコング2とバスの旅(Donkey Kong Country 2 and Open Bus)
ドンキーコングカントリー2をZSNESエミュレーターでプレイすると、特定のステージで回転する樽に影響を与えるバグが知られています。このバグにより、プレイヤーは樽の回転を制御できず、エミュレーターが樽を無限に一方向に回転させてしまいます。この問題は、特に危険な要素があるレベルでゲームを意図以上に難しくしています。
このバグは、ZSNESが「オープンバス動作」をエミュレートしていないことから発生します。オープンバス動作とは、スーパーファミコンが無効なメモリアクセスを処理する方法です。ゲームがマッピングされていない特定のメモリアドレスから読み取ろうとすると、最後に使用された値を返すべきですが、ZSNESはこれを正しく再現できていません。
この問題に対する以前の修正は、別のエミュレーターであるSnes9xで行われましたが、ZSNESは2007年の最後の更新以来、修正されていません。問題は、ゲームがメモリにアクセスする方法、特にマッピングされていないアドレスから読み取る際にあります。ゲームコードの分析によれば、特定の命令を絶対アドレス指定から即時アドレス指定に変更することで、樽が正しく動作するようになります。
この調査は必要性からではなく好奇心から行われました。他のほとんどのスーパーファミコンエミュレーターはゲームを正しく処理しているためです。著者は、このバグがゲームのメモリアクセスロジックにおける単純なコーディングエラーによるものであると結論づけています。
3.Cの起源メモリモデル(The provenance memory model for C)
新しいプロヴェナンスメモリモデルの開発が、さまざまな大学の研究者によって進められています。このモデルは、プログラム実行中にポインタ値の起源を追跡する方法を明確にし、現在のC言語標準における曖昧さを解消することを目的としています。その成果として、ISO/IEC TS 6010という技術仕様が作成され、現代の情報システムにおける安全性とセキュリティの向上を目指しています。
重要なポイントとして、まずポインタのエイリアシングと最適化があります。エイリアシングとは、二つのポインタがメモリ内の同じオブジェクトを指している状態を指します。エイリアシングを理解することは、コードの最適化において重要です。コンパイラはエイリアシングの可能性を分析し、最適化の判断を行いますが、誤った仮定がバグを引き起こすことがあります。
次に、現在のC言語の状態についてですが、既存のC標準ではプロヴェナンスが明確に定義されておらず、プログラマーやコンパイラ開発者の間でエイリアシングの仮定に混乱を招いています。
また、エイリアス分析のメカニズムについても触れます。現代のコンパイラは、型ベースやフローベースのエイリアス分析を用いてポインタの使用に関する情報を推測しますが、これらの方法には限界があり、プログラマーの責任が求められます。
新しいプロヴェナンスモデルでは、「ストレージインスタンス」や「プロヴェナンス」といった概念を導入し、ポインタとメモリの関係を明確にします。異なるメモリの割り当てやそのライフタイムを区別し、ポインタの動作を理解するための枠組みを提供します。
さらに、モデルはポインタのプロヴェナンスがいつ露出するか(エイリアシングの問題を引き起こす可能性がある)と、いつ合成されるか(他の情報から作成される)を定義しています。この区別は、ポインタの相互作用の複雑さを管理するのに役立ちます。
最後に、最適化の機会を維持し、複雑さを避けるために、プログラマーはポインタの露出を最小限に抑えることが推奨されています。具体的には、ポインタのキャストや、ポインタの個々のバイトへのアクセス、特定の印刷関数の使用を避けることが含まれます。
この新しいプロヴェナンスメモリモデルは、C言語におけるポインタの使用とエイリアシングに関する明確なガイドラインを提供することで、コードの安全性を高め、コンパイラの性能を最適化することを目指しています。
4.新しい円相 - 初のベータ版(New Ensō – first public beta)
Ensōは、執筆プロセスと編集を分けることで集中力を高めるために設計されたツールです。この方法は、自己編集をせずに自由に書くことを促します。創作者は、6年間で200万語を書いた経験をもとに、Ensōをより多くの人にとって使いやすくできると考えています。詳細については、提供されたリンクを訪れてください。
5.幻の物語、40年の旅(The Plot of the Phantom, a text adventure that took 40 years to finish)
ブログ記事では、「ファントムの陰謀」というテキストアドベンチャーゲームの完成を発表しています。このゲームは、著者が40年前にティーンエイジャーの頃に始めたもので、古典的なテキストアドベンチャーゲーム「ゾーク」に触発されて作られました。当初は技術的な制約や著者の興味の変化により中断されましたが、COVID-19パンデミックの間に著者はこのプロジェクトを再訪し、現代のプログラミング言語であるインフォーム7を使ってゲームを再構築し、更新しました。
新しいバージョンでは、より発展したストーリーラインが追加され、暴力的な要素が減らされています。オリジナルのゲームの本質を保ちながら、自伝的な要素や新しいパズルも加えられています。完成したゲームはウェブブラウザでプレイ可能で、約1〜2時間でクリアできます。著者はこの長期プロジェクトの完成に対して複雑な感情を抱いており、まるで幽霊を安らかにするような気持ちだと表現しています。
6.グリッドフィニティ: モジュラー型ストレージ(Gridfinity: The modular, open-source grid storage system)
Gridfinityのオンラインジェネレーターを使ってみましょう。自分のサイズを入力することで、カスタムの収納ボックスやベースプレートを作成できます。詳細はgridfinitygenerator.comをご覧ください。
Gridfinityは、作業場での整理整頓や生産性向上を目的とした、無料のオープンソースのモジュラー収納システムです。主に3Dプリント可能で、アレクサンダー・チャペルのアソートメントシステムに触発されたデザインを基に、ザック・フリードマンによって開発されました。
Gridfinityのコミュニティは、システムを積極的に改善し、適応させています。デザインを使用したり変更したりすることで、コミュニティに参加して貢献することができます。さらに交流を深めたい方は、ザックのDiscordの#gridfinityチャンネルに参加してください。
7.3Dプリント回路(Printegrated Circuits: Merging 3D Printing and Electronics)
オリバー・チャイルドが主導する新しい3Dプリントのアプローチでは、印刷された物体に電子部品を直接埋め込む手法が採用されています。この方法により、プリント基板や導電性の要素をより簡単に統合できるようになり、3Dプリントされた製品がよりスマートで機能的になります。この開発は、特にホビー愛好者やIoT(モノのインターネット)に興味を持つ人々のために、消費者向け電子機器の機能を向上させることを目指しています。
8.計算の空間革命(New proof dramatically compresses space needed for computation)
MITのコンピュータ科学者ライアン・ウィリアムズの最近の発見は、計算時間とメモリ空間の関係に関する長年の信念に挑戦しています。約50年間、問題を解くのに必要なステップ数tに対して、tビットのメモリが必要だと考えられていました。しかし、ウィリアムズは、時間tで解決可能な問題は実際には約√tビットのメモリで処理できることを発見しました。つまり、通常100ステップかかる作業が約10ビットのメモリで実行できるということです。
ウィリアムズの画期的な成果は、「還元」と呼ばれる手法を用いて、異なる問題が互いに変換可能であることを示しています。これにより、メモリのより効率的な利用が可能になります。この発見は、コンピュータにおける真の制約はメモリの量ではなく、その利用の仕方であることを示唆しています。この進展に対して専門家たちは興奮しており、以前は必要だと考えられていたよりも少ないメモリで複雑な問題を解決する新たな可能性が開かれました。
9.20ドルで宇宙ステーション追跡!(Open-Source International Space Station Tracker ESP32/Arduino for $20)
国際宇宙ステーショントラッカーは、20ドルのESP32 CYD(安価な黄色いディスプレイ)を使用したプロジェクトです。このトラッカーはWi-Fiを通じてリアルタイムで更新され、タッチスクリーンとバックライトの電源管理機能を備えています。このプロジェクトは、教室でのSTEM(科学、技術、工学、数学)活動に適した手頃で魅力的な選択肢であり、完全にオープンソースです。
10.今、何に挑戦中?(What Are You Working On? (June 2025))
最近のプロジェクトについて教えていただけますか?新しいアイデアを考えていることはありますか?
11.VercelのBotID解析(Reverse Engineering Vercel's BotID)
ブログ記事では、ボット対策システムの複雑さと課題について、特にVercelの新しいBotID機能に焦点を当てています。以下は主なポイントです。
ボット対策システムの目的は、オンラインビジネスを資格情報の詰め込み攻撃やサービス拒否攻撃などの脅威から守ることです。しかし、これらの対策はしばしば侵入的な手法に依存しており、特に非標準のブラウザやオペレーティングシステムを使用している正当なユーザーに影響を与えることがあります。
Vercelが導入したBotIDは、「目に見えないCAPTCHA」で、視覚的な挑戦なしにボットを検出します。BotIDには、基本モード(無料)と深層分析モード(有料)の2つのモードがあります。基本モードはクライアント側の信号を使用してボットを特定し、深層分析モードはより高度なスクリプトを利用して検出精度を向上させます。
Next.jsプロジェクトでのBotIDの設定は簡単で、パッケージを追加し、確認用の簡単なコードを記述するだけです。
記事では、BotIDプロセス中に取得されるスクリプトの技術的な詳細についても触れています。このスクリプトは、その機能を隠すために難読化技術を使用していることが明らかになっています。著者は、コードを難読化解除してその動作を分析する方法について説明しています。
自動化ツールやヘッドレスブラウザを検出するために、ナビゲーターのプロパティやWebGLの詳細を調べるなど、さまざまなチェックが実施されています。これらの検出は、ボットのような行動を特定することを目的としています。
基本モードは現在、ボットを検出するのに効果的ではなく、多くの自動スクリプトが人間のユーザーとして通過できてしまいます。Vercelがデータを収集して検出能力を強化するにつれて、状況は変わる可能性があります。
深層分析モードは、ボット検出を改善するためにより多くの信号を積極的に収集し、より良い保護を提供することが推奨されています。このモードは追加のコストがかかり、人間とボットのトラフィックを区別するためにより高度な技術を使用します。
著者は、ボット対策システムにおけるフィンガープリンティングやデータ収集への依存が高まることに懸念を示しています。これにより、「正常な」ユーザーとは何かについての理解が歪む可能性があります。
全体として、この記事はこれらのボット対策技術がオープンウェブに与える影響や、今後の進化についての議論を呼びかけています。
12.CPUファンの幻影(I made my VM think it has a CPU fan)
マルウェアは、仮想マシン(VM)で動作しているかどうかを確認するために、通常の環境には存在しないハードウェアコンポーネント、例えばCPUファンをチェックします。その一つの方法として、Windows Management Instrumentation(WMI)のWin32_Fanクラスを照会することがあります。これは、セキュリティ研究者がマルウェアを分析するのを難しくするために行われます。
仮想マシンにCPUファンがあると錯覚させるためには、システム管理BIOS(SMBIOS)データを操作する必要があります。特に、冷却装置に関連するタイプ27のエントリを作成します。これには、CPUファンや関連コンポーネントに関する必要なデータを含むカスタムSMBIOSファイルを作成することが含まれます。
Xenの場合、カスタムSMBIOSデータはドメイン設定ファイルに設定できますが、構造のサイズを前に追加するなどの追加手順が必要です。一方、QEMU/KVMのユーザーにとっては、プロセスが簡単で、データ構造を変更することなく、-smbiosオプションを直接使用できます。
SMBIOSデータを変更することで、仮想マシンがCPUファンを持っていると信じ込ませることができ、マルウェアによる検出を回避するのに役立ちます。
13.ウィンドウズ向けLispクロスコンパイル(Cross-Compiling Common Lisp for Windows)
Cのクロスコンパイルとは、現在使用しているプラットフォームとは異なるプラットフォーム向けにコードをコンパイルするプロセスを指します。DLLへのリンクは、プログラムをダイナミックリンクライブラリ(DLL)に接続することを含みます。DLLには、複数のプログラムで使用できるコードやデータが含まれています。
SBCL(スティールバンクコモンリスプ)は、Lispプログラムを実行するためにインストールできるコモンリスプの実装です。パス名は、システム内でファイルやディレクトリがどのように整理され、アクセスされるかを指します。
Emacsというテキストエディタ内でSBCLを使用するには、Wineを通じて実行することで、Windowsアプリケーションを他のオペレーティングシステム上で動かすことができます。WindowsのDLLをプログラムで使用する方法については、これによりDLLが提供する機能やリソースにアクセスできるようになります。
最後に、実行可能ファイルをビルドすることは、コンピュータ上で実行できるスタンドアロンのプログラムを作成する最終ステップです。これらのポイントは、特にCとLispを用いたクロスプラットフォーム環境でのプログラミングに関する手順や考慮事項を網羅しています。
14.Ubuntu: Introducing Debcrafters(Ubuntu: Introducing Debcrafters)
要約がありません。
15.A glob of 99M-year-old amber trapped a zombie fungus erupting from a fly(A glob of 99M-year-old amber trapped a zombie fungus erupting from a fly)
要約がありません。
16.Revisiting Knuth's “Premature Optimization” Paper(Revisiting Knuth's “Premature Optimization” Paper)
要約がありません。
17.港の新兵器!(Cell Towers Can Double as Cheap Radar Systems for Ports and Harbors (2014))
携帯電話の基地局を利用して、小型船を検出する低コストのレーダーシステムを構築することができます。この技術は、携帯電話の信号を受信して船の位置を特定する仕組みです。これにより、港やハーバーの安全性を向上させることが可能になります。
18.Ultrasound toothbrush promises painless checks for hidden gum problems(Ultrasound toothbrush promises painless checks for hidden gum problems)
要約がありません。
19.Jane Austen's Boldest Novel Is Also Her Least Understood(Jane Austen's Boldest Novel Is Also Her Least Understood)
要約がありません。
20.日光トラッカー作成!(I built a daily sunlight tracker)
屋外の光の重要性を話すだけではなく、実際に示す方が効果的だと気づきました。そのため、私たちはApple WatchやiPhoneを使って光の曝露を追跡する無料のアプリを作りました。このアプリは、十分な光を浴びているかどうかを教えてくれ、日々の光の取り入れ方を記録し、ホルモンのバランスを整える健康的な習慣を奨励します。現在、TestFlightでベータ版を公開しており、皆さんのフィードバックをお待ちしています。
21.データセンターの温度と電力(Data Centers, Temperature, and Power)
データセンターの構築は、単にハードドライブを電源やインターネットに接続するだけではありません。特に人工知能(AI)の普及に伴い、データの需要が高まる中で、電力と温度の管理が重要になります。
データセンターは規模や電力のニーズが異なります。最大のデータセンターはバージニア州北部にあり、2,552メガワットの容量を持ち、約20万世帯を賄うことができます。2023年には、データセンターが消費した電力は7.4ギガワットで、これは世界の電力消費の約1〜1.3%に相当します。IT全体のエネルギー使用を考慮すると、この割合は約10%に増加します。データセンターは常に稼働していることを目指し、停電を防ぐために複数の電源を利用しています。
電力効率を示す指標として「電力使用効率(PUE)」があります。これは、全体のエネルギー使用量と計算に使われるエネルギー量を比較するもので、冷却システムが約40%の電力を消費することを示しています。最適な温度を維持することは重要で、過剰な熱は機器に損傷を与える可能性があります。そのため、電力消費を削減し、熱の発生を管理する戦略が必要です。
熱はIT負荷やサーバーの稼働、外部要因(周囲の温度や人の存在)によって発生します。効果的な温度管理には、熱の発生を抑え、データセンターを効率的に冷却することが求められます。冷却方法には空気冷却や水冷システムがあり、最近では浸漬冷却と呼ばれる新しい技術も注目されています。
データセンターは大きなカーボンフットプリントを持ち、50,000世帯に相当するエネルギーを消費しています。エネルギーコストが上昇し、環境への懸念が高まる中で、エネルギー効率の向上は持続可能性にとって不可欠です。再生可能エネルギーの導入も重要で、データセンターの需要に応えるために電力網のアップグレードへの投資が必要です。
データセンターへの依存が高まる中で、エネルギー管理や冷却技術における革新的なアプローチが、効率性と持続可能性を確保するために必要です。
22.形は機能を決める?(Does Form Shape Function?)
この記事では、ハーバード大学のL. マハデヴァン教授の研究について紹介しています。彼は、物理的な力、環境、そして生物学の相互作用から、複雑な生物の形状や行動がどのように生まれるかを探求しています。マハデヴァンは、メビウスの帯や脳のひだ、シロアリの巣などのさまざまな例を通じて、形が生物システムの機能にどのように影響を与えるかを示しています。
形と機能の相互作用について、マハデヴァンは自然界の形状、特に脳のひだが物理的なプロセスや制約からどのように生じるかを研究しています。彼は、幾何学が生物の機能とどのように結びついているかを明らかにしています。
生物システムに関する研究では、脳のひだが脳組織の成長と膨張によってどのように形成されるかを理解することに焦点を当てています。この成長は、さまざまな脳の機能を促進する複雑なパターンを生み出します。
また、マハデヴァンは、シロアリのような社会性昆虫が中央の計画なしに巣を作る方法を調査しています。これは、環境の課題に対処するための集団行動を示しています。
この記事では、生物とその環境との関係が強調されており、相互に影響を与え合うフィードバックループの重要性が示されています。
マハデヴァンは、好奇心を持ってさまざまな生物学、数学、物理学のトピックを探求することに情熱を注いでおり、科学的発見における好奇心の重要性を強調しています。
全体として、この議論は生物の形状の複雑さと、構造、機能、環境の関係を理解することの重要性を強調しています。
23.チート対策速報(Anticheat Update Tracking)
この文章では、ビデオゲームで使用されるさまざまなアンチチートシステムの更新を追跡する方法について説明しています。
まず、アンチチートの更新を追跡する目的について述べられています。著者は、新しいリリースや変更を理解し、研究のために古いバージョンを使用するために追跡を行いたいと考えました。
次に、EasyAntiCheat(EAC)について説明があります。EACは、RustやFortniteなどの人気ゲームで使用されています。以前は独自のコンテンツ配信ネットワーク(CDN)を持っていましたが、Epic GamesのCDNに切り替えたため、更新の取得方法が変わりました。更新ファイルは暗号化されており、実際のコンテンツにアクセスするには復号化アルゴリズムが必要です。
Battleyeについても触れられています。このアンチチートは、静的な署名を通じて既知のチートを検出することに重点を置いており、Escape from Tarkovなどのゲームで使用されています。CDNはシンプルで、最新バージョンのURLやタイムスタンプに基づいたダウンロードリンクがあります。
EA Anti-Cheat(EA-AC)は2022年に導入され、FIFAなどのゲームで使用されています。インストーラーは抽出可能ですが、ドライバーはゲームが実行中でないと取得できません。
Vanguardは、Riot GamesがValorantやLeague of Legendsのために開発したものです。公開APIを提供しており、更新の追跡が容易で、直接ダウンロードリンクも含まれています。
一般的な観察として、異なるアンチチートはさまざまなCDN構造を使用しており、追跡が容易なものもあれば、そうでないものもあります。これらのシステムの主な目的は、更新方法そのものではなく、ゲームを保護することです。
他にもいくつかのアンチチートが言及されています。EQU8はSplitgateで使用されており、シンプルな更新URL構造を持っています。FACEITは厳格なチェックと限られた公開情報で知られています。ESEAはアカウントが必要で、ダウンロード時にCAPTCHAがあるため、追跡が難しくなっています。
著者は、アンチチートシステムに関する過去の経験を振り返り、研究プロセスを楽しんでいることを表現しています。
24.迅速イベント配信(Event – Fast, In-Process Event Dispatcher)
このパッケージは、Go用の高性能なイベントディスパッチャーを提供し、アプリケーション内の異なる部分間の通信を改善します。同期的および非同期的なイベント処理が可能で、迅速かつシンプルな処理を実現します。
主な特徴として、毎秒数百万のイベントを処理できるスピードがあります。これは従来のチャネルよりも大幅に速いです。また、イベントインターフェースを実装している任意の型と互換性があり、汎用的に使用できます。非同期処理により、各サブスクライバーは独自のゴルーチンでイベントを処理するため、遅延を防ぎます。
このディスパッチャーは、単一のGoアプリケーション内でモジュールを分離したい場合や、軽量なパブリッシュ/サブスクライブ、イベント駆動型の設計に適しています。低遅延で迅速なイベントディスパッチが必要な場合や、依存関係のないシンプルな解決策を好む場合にも向いています。
ただし、異なるプロセスやサービス間の通信には推奨されません。その場合はKafkaやNATSを検討してください。また、イベントの保存、高度なルーティングやフィルタリング、複数のプログラミング言語やプラットフォームを含むシナリオ、イベントの再生や重複処理、サブスクライバーリストの頻繁な変更には適していません。
使用例としては、デフォルトのディスパッチャーを使用して迅速なイベント処理を行い、イベントに簡単にサブスクライブしたり、発行したりできます。特定のディスパッチャーを作成することで、複数のサブスクリプションやイベントタイプを管理することも可能です。
パフォーマンスベンチマークでは、従来のチャネルに比べて大幅な性能向上が示されており、結果は設定によって異なります。
このプロジェクトはMITライセンスのもとで提供されています。
25.ネイティブJIT: C++からx64へ(NativeJIT: A C++ expression –> x64 JIT (2018))
NativeJITは、Cデータ構造を使用して式を効率的に即時コンパイルするために設計されたオープンソースのライブラリです。このライブラリは軽量で高速であり、Linux、OSX、Windowsに対応しており、標準のC++ランタイムのみを必要とします。Bingチームによって開発され、主にBing検索エンジンでのユーザーのクエリに基づいて文書のスコアリングに使用されます。
主な特徴には、最適化されたレジスタ割り当てによる迅速なコンパイル、実行時まで知られていない式の処理能力、算術演算、論理演算、関数呼び出しなどのさまざまな操作のサポートがあります。
具体的な例として、NativeJITを使用して円の面積を計算する方法が示されています。このライブラリは、異なるプラットフォーム向けに最適化されたアセンブリコードを生成できます。
NativeJITをビルドするための依存関係としては、CMake(2.8.11以上)と最新のC++コンパイラ(gcc、clang、またはVisual Studio)が必要です。インストール手順はプラットフォーム(Linux、OSX、Windows)によって異なり、環境を設定するための具体的なコマンドが提供されています。
全体として、NativeJITは動的な式の処理において高いパフォーマンスを発揮するように設計されており、迅速な応答時間と効率的なリソース利用が求められるアプリケーションに適しています。
26.Want to meet people, try charging them for it?(Want to meet people, try charging them for it?)
要約がありません。
27.尿素の自然生成(How urea forms spontaneously)
ETHの研究者たちは、生命の起源において重要な分子である尿素が、水の表面で追加のエネルギーなしに自然に形成される新しい方法を発見しました。この発見は、尿素が二酸化炭素(CO₂)とアンモニア(NH₃)から、通常の条件下で小さな水滴の中で生成される可能性があることを示しています。これにより、初期の地球における尿素の蓄積の理由が説明できるかもしれません。
尿素は肥料やその他の製品に使用される重要な工業化学物質であり、RNAやDNAのような生物分子の形成においても重要だった可能性があります。従来、尿素の生成には高温や高圧、または触媒が必要でしたが、この新しい反応は水滴の表面で自然に起こります。そこでは空気と液体が接触しています。
研究者たちは、水の表面という特異な環境がこの反応を容易にすることを観察しました。これは、初期の地球の大気中で、CO₂やアンモニアが豊富に存在していた時代に、同様のプロセスが起こった可能性を示唆しています。この研究は、生命の起源に関する洞察を提供するだけでなく、将来的に環境に優しい尿素の製造方法を示唆しています。
28.メドレー復活!(The Medley Interlisp Project: Reviving a Historical Software System [pdf])
メドレー・インタリスププロジェクトは、1970年代と80年代に開発された高度なプログラミング環境であるメドレー・インタリスプを復活させ、現代のシステムで利用できるようにすることを目指しています。このプロジェクトは2020年に元のインタリスプ開発者たちによって設立され、メドレー・インタリスプを復元し、現代の機能を追加することを目的としています。主な目標は以下の通りです。
まず、メドレーを現在のオペレーティングシステムで動作させることです。次に、現代のハードウェアとの互換性を向上させることが挙げられます。また、メドレーのソフトウェアアーキテクチャを更新し、より良い相互運用性を実現することも重要です。さらに、バグを修正し、未完成の機能を完成させることが求められています。インタリスプに関連する文書の有用な文献目録を作成することも目指しています。そして、メドレーの歴史的背景を保つことも重要な課題です。
このプロジェクトは、古い文書の不備や、復帰する開発者にとっての学習曲線の大きさ、古いソフトウェアを新しいシステムに対応させる必要性など、いくつかの課題に直面しています。しかし、メドレーを現代のオペレーティングシステムで動作させることや、ウェブブラウザを通じてアクセスできるオンライン版の開発など、進展も見られています。
また、プロジェクトは大学やフリーランスとの協力を重視しており、特にこの分野に慣れ親しんだ学生との連携が成功を収めています。メドレー・インタリスププロジェクトは、同様の歴史的ソフトウェア復元の取り組みのモデルとなっており、古いシステムからの貴重なアイデアが現代のプログラミングに役立つことを証明しています。
29.ロシア語キーボードの謎(Many ransomware strains will abort if they detect a Russian keyboard installed (2021))
最近のTwitterでのランサムウェアに関する議論では、DarkSideのような多くのランサムウェアプログラムが、特定の仮想キーボードを使用しているWindowsコンピュータへのインストールを防ぐための安全装置を持っていることが明らかになりました。特にロシアやウクライナなどの東欧諸国のキーボードが対象です。これは、彼らの母国で法的な問題を避けるためで、地元の当局は通常、誰かが苦情を申し立てない限り、サイバー犯罪を調査しないからです。
DarkSideグループは、アメリカのコロニアルパイプラインに対するランサムウェア攻撃を引き起こしたことで知られていますが、彼らは「政治的ではない」と主張し、利益を上げることに専念しているとしています。しかし、彼らのマルウェアは、特定の国のコンピュータに感染しないように設計されており、監視を避けるためです。
専門家は、除外された国の仮想キーボードをインストールすることで、いくつかのランサムウェアからの保護が得られる可能性があると指摘しています。すべてのマルウェアを防ぐことはできませんが、この簡単な手順によって、法的な問題を避けたい攻撃者を抑止することができるかもしれません。
一部のマルウェアは最終的にこれらの言語チェックを無視するかもしれませんが、それでも使用することで防御の層を提供することができます。また、実際にロシア語のキーボードをダウンロードせずに、Windowsの設定を変更してそのように見せる方法も提案されています。全体として、このアプローチは完璧ではありませんが、ランサムウェア攻撃のリスクを軽減するための簡単で無料の方法となる可能性があります。
30.The $25k car is going extinct?(The $25k car is going extinct?)
要約がありません。
31.安全なコンテナ構築法(Building untrusted container images safely at scale)
多くのSaaSプラットフォームでは、顧客のコードを安全かつ迅速に実行する方法が求められています。独自のコンテナシステムを作成する代わりに、DepotのAPIを利用することでこのプロセスを簡素化できます。このガイドでは、隔離されたプロジェクトを設定し、ビルドを管理し、顧客のタスクのパフォーマンスを監視するためのGoツールの開発方法について説明します。
32.キーワード引数の力(Use keyword-only arguments in Python dataclasses)
Pythonのデータクラスは、主にデータを扱うクラスを作成するのに便利で、辞書や従来のクラス定義に比べていくつかの利点があります。データクラスを維持するための有用なヒントは、定義時にkw_only=True
を使用することです。これにより、すべてのパラメータを位置引数ではなくキーワード引数として渡す必要があります。
kw_only=True
を使用することには、主に二つの利点があります。一つ目は、フィールドの順序を変更できることです。これにより、データクラスを使用している既存のコードを壊すことなく、フィールドの順番を変えることができます。二つ目は、サブクラスの柔軟性です。サブクラスは特定のフィールドを必須にすることができ、すべてのフィールドにデフォルト値を提供する必要がなくなるため、必須フィールドの管理が容易になります。
このアプローチは、互換性と柔軟性を維持する必要があるライブラリ開発者にとって特に重要です。
なお、kw_only=True
の機能はPython 3.10で導入されました。古いバージョンをサポートする必要がある場合は、この機能を条件付きで有効にし、サブクラスが適切にフィールドを管理できるようにすることができます。
33.シェーダーの書(The Book of Shaders (2015))
「The Book of Shaders」は、コンピュータグラフィックスにおける重要な要素であるフラグメントシェーダーを理解するための初心者向けガイドです。
この本は、シェーダーとは何か、そしてどのように始めるかを説明する「イントロダクション」から始まります。次に「アルゴリズミックドローイング」では、数学的な関数を使って形や色、パターンを作成する技術が紹介されています。「ジェネレーティブデザイン」では、ランダム性やノイズ、フラクタルといった概念を用いて複雑なデザインを生み出す方法が説明されています。「画像処理」では、テクスチャを扱い、さまざまな画像フィルターやエフェクトを適用する方法について議論されています。「シミュレーション」では、波紋や反応拡散といったシミュレーションを通じて動的なビジュアルを作成する方法が解説されています。「3Dグラフィックス」では、ライティングやマッピング技術、3D環境でのレンダリングについて扱っています。
著者は、技術とアートの交差点に焦点を当てたアーティスト兼開発者のパトリシオ・ゴンザレス・ビーボと、データコミュニケーションや技術が社会に与える影響に関心を持つデータサイエンティスト兼教育者のジェン・ロウです。
この本にはさまざまな例や用語集、さらなる学習のための追加リソースが含まれています。また、複数の言語で提供されており、より多くの人々に内容を届けるための共同作業の成果を反映しています。
34.アフリカのがん薬、20%が不良品(Nearly 20% of cancer drugs defective in four African nations)
最近、The Lancet Global Healthに発表された研究によると、エチオピア、ケニア、マラウイ、カメルーンで流通しているがん治療薬の約17%が基準を満たさないか、偽造品であることが明らかになりました。これは、多くの患者ががん治療に必要な正しい有効成分を含まない無効または有害な薬を受け取っている可能性があることを意味します。
この研究は、アメリカとアフリカ全体のチームによって行われ、さまざまな病院や薬局からほぼ200種類の製品が検査されました。抗生物質や抗マラリア薬など、他の医薬品でも同様の問題が以前から指摘されていましたが、がん治療薬に特化した重要な研究はこれが初めてです。
これらの問題の原因には、製造上の誤り、保管条件の不備、偽造品の存在が含まれます。基準を満たさない薬を見つけることは難しく、目視検査では見分けられないことが多いため、正確な識別には laboratory testing(実験室での検査)が必要です。
状況を改善するためには、より良い規制、医療提供者への教育、検査技術の開発が求められます。世界保健機関(WHO)は、影響を受けた国々と協力してこれらの問題に対処しており、こうした問題を防ぐための規制強化を呼びかけています。
この研究は深刻な問題を浮き彫りにしましたが、検査された製品の約3分の2は良好な品質であることも示しており、信頼できる供給者が存在することを示しています。これらの結果は、アフリカにおけるがん治療の安全性と有効性を確保するために、緊急の行動が必要であることを強調しています。
35.Let's Encrypt終了通知(LetsEncrypt – Expiration Notification Service Has Ended)
Let’s Encryptは2025年6月4日をもって、証明書の有効期限通知メールの送信を終了しました。この決定の主な理由は以下の通りです。
まず、多くの利用者が証明書の更新を自動化しているため、通知がそれほど必要でなくなったことが挙げられます。次に、何百万ものメールアドレスを保持することはプライバシーの懸念を引き起こすため、この要件を廃止することにしました。また、通知を送るためのコストが年間数万ドルに達し、その資金を他の用途に使った方が良いと判断しました。さらに、通知システムの管理は不必要な複雑さを生み出し、エラーの可能性も高めるため、これを解消することにしました。
それでも通知を希望する方には、Red Sift Certificates Liteなどの第三者サービスを利用することをお勧めします。このサービスは最大250件の証明書について無料で監視を提供しています。
Let’s Encryptは以前に保存されていたメールアドレスを削除し、新たにメールアドレスを保存することはありません。新しいアドレスは、アカウントデータに関連付けられない一般的なメーリングリストに転送されます。Let’s Encryptに関する最新情報を受け取りたい場合は、彼らのメールリストに登録することができます。
36.Finding a former Australian prime minister’s passport number on Instagram (2020)(Finding a former Australian prime minister’s passport number on Instagram (2020))
要約がありません。
37.Modelling API rate limits as diophantine inequalities(Modelling API rate limits as diophantine inequalities)
要約がありません。
38.アップル店の壁にタッチ(Touching the back wall of the Apple store)
高校時代、著者と友人たちはアップルストアでゲームをしていました。彼らはスタッフに近づかれずに、後ろの壁に触れて出口に出ることを目指していました。この店は高級商品に触れることができるため、彼らにとって魅力的でした。しかし、スタッフが頻繁に顧客と交流するため、接触を避けるのは難しかったのです。著者はこのゲームを成功させたのは数回だけで、初めて自分のiPodを買ったときのことを思い出します。そのお金は夏のキャンプのアルバイトで稼いだものでした。
iPodを購入する体験は、ワクワクしながらも緊張感がありました。高級品を手に入れたい気持ちと、店の雰囲気に対する批判的な感情の間で葛藤していたのです。著者は、店が若者に自由に探索させる戦略は、将来の顧客を引き寄せるためであることに気づきました。また、以前使っていた一般的なMP3プレーヤーが自分の人生に与えた影響についても振り返ります。それはメディアの海賊行為に興味を持たせ、コンピュータスキルを向上させるきっかけとなり、iPodの高級購入よりも重要な経験だったと感じています。
39.オクテルム:FOSSの新選択肢(Octelium – FOSS Alternative to Teleport, Cloudflare, Tailscale, Ngrok)
Octeliumはオープンソースのプラットフォームで、企業のVPNやリモートアクセスツールと同様に、安全なリモートアクセスを提供します。2025年5月に一般公開されました。Octeliumは多目的に利用でき、企業のVPNとして機能したり、ゼロトラストネットワークアクセス(ZTNA)ソリューションとしても使用できます。また、APIやAIのゲートウェイとしての役割も果たします。さまざまな環境で安全にアクセスできるように、柔軟でスケーラブルなアーキテクチャを提供するように設計されています。詳細な機能については、プロジェクトのドキュメントを参照してください。
40.サーバー市場の腕力(Arm muscles into server market – but can't wrestle control from x86 just yet)
Armベースのサーバーの人気が高まっており、2025年には出荷量が70%増加すると予測されています。しかし、Armの目標である世界のデータセンターCPU市場の50%を占めるにはまだ遠い状況です。現在、Armサーバーは今年の世界全体の出荷量の21.1%を占めるとIDCは見込んでいます。
全体のサーバー市場は急成長しており、2025年初頭には950億ドルに達し、前年から134.1%の増加を記録しています。IDCは市場全体の価値が3660億ドルに達し、過去最高を更新すると予測しています。x86サーバーは39.9%の成長が見込まれていますが、Armを含む非x86システムは63.7%と、より早い成長が予想されています。
アメリカが最も大きな成長を見込まれている一方で、中国でも強い販売が見られています。対照的に、カナダなどの地域では減少が予想されています。特にAI処理のための計算能力の需要がこの成長を促進しており、高度な処理能力の必要性が高まっています。
41.マイクロチップ逆解析(Reverse Engineering the Microchip CLB)
マイクロチップは、PIC16F13145マイクロコントローラーに「構成可能ロジックブロック(CLB)」という新機能を導入しました。CLBは、32のルックアップテーブル(LUT)を持つ小型のFPGAのように機能し、チップの内部システムに接続できます。しかし、設定プロセスに関する情報はあまり詳しく説明されておらず、ユーザーはオンラインツールを使ってAPIを利用して設定するよう指示されています。また、CLBは標準のレジスタを通じて直接アクセスすることはできず、MicrochipのMPLAB IDEを使用してプログラムする必要があります。
CLBをより理解し、設定するために、著者はリバースエンジニアリングを行うことに決めました。このプロセスは、背景情報、ハードウェアテスト、そして自分で試すためのガイドの三つのセクションに分けられています。
42.YouTubeでロボット革命!(We accidentally solved robotics by watching 1M hours of YouTube)
研究者たちは、ロボティクスにおける重要な課題を解決しました。彼らは、100万時間のYouTube動画を利用して、ニューラルネットワークに現実世界での物理的相互作用を教えました。従来の言語モデルは、物体を持ち上げるといったタスクに苦労しており、これは言語に焦点を当てているため、物理を理解することができないからです。
新しいアプローチであるV-JEPA 2は、言葉ではなく現実の動きを予測するモデルを訓練します。このモデルは、主に三つの要素から成り立っています。一つ目は、動画を分析して物理的な状況を把握するエンコーダーです。二つ目は、動画の欠けている部分を補完する予測器です。三つ目は、個々のピクセルではなく、重要な動作を強調する形で動画データを埋め込む独自の方法です。
データとモデルの規模を拡大し、段階的な訓練アプローチを用いることで、V-JEPA 2は素晴らしい結果を示しました。新しい環境でロボットを成功裏に展開し、物体をつかむ、移動させるといったタスクで高い成功率を達成しました。また、迅速な計画を実現し、ロボットが素早く意思決定を行えることも示しました。
しかし、カメラの位置に敏感であることや、長期的な計画に関する課題など、いくつかの制約も存在します。今後の研究では、視覚的な補助なしでロボットが命令を理解する方法を改善することを目指しています。
このブレークスルーは、物理を理解することがロボットにとってもAIにおける言語理解と同じくらい重要である可能性を示唆しており、将来的にはより能力の高いロボットが実現するかもしれません。
43.ポストへGO!(To the Postbox)
「相対的価値」という概念は、何かの価値や重要性が他のものと比較してどのように決まるかを指します。これは、価値が絶対的なものではなく、比較によって変わることを示しています。
この考え方は、経済学や倫理学、個人関係などさまざまな分野で応用されます。そこで、物や行動、信念の重要性は、その文脈や関与する人々の視点に基づいて評価されます。
全体として、「相対的価値」は、私たちが価値があると考えるものが状況や視点によって変わることを強調しています。
44.正の数の完全リスト(Sequence and first differences together list all positive numbers exactly once)
OFFSET数列は、数列とその差がすべての正の整数を一度ずつ含む最も初期の配置です。この数列は、スコット・キムの図に関連してホフスタッターによって紹介されました。数列は0から始まり、次の項は前の項と、数列にまだ含まれていない最も最近の数の合計です。
具体的な数列の例としては、1、3、7、12、18、26、35、45などがあります。これらの項の間の差は、2、4、5、6、8、9、10などです。この数列は特定の数学的ルールによって定義されており、さまざまなプログラミング言語を使って生成することができます。
この数列には多くの参考文献や関連する数列があり、数学の研究における重要性を示しています。全体として、この数列はその独特な性質や他の整数数列との関連性から興味深いものです。
45.例で学ぶブルームフィルター(Bloom Filters by Example)
ブルームフィルターは、メモリ効率の良いデータ構造で、要素が集合に含まれているかどうかを迅速に確認できます。要素が確実に集合に含まれていないことは分かりますが、含まれているかどうかを確定することはできません。
この仕組みでは、ビットベクターと呼ばれるビット(0と1)から成る配列を使用します。要素を追加する際には、その要素を複数回ハッシュ化し、対応するビットを1に設定します。要素が集合に含まれているかを確認する場合は、再度ハッシュ化してビットをチェックします。もしビットの中に0があれば、その要素は集合に含まれていないことが分かります。全てのビットが1であれば、含まれている可能性があります。
ブルームフィルターは確率的な性質を持っており、誤陽性が発生することがあります。つまり、要素が集合に含まれていないのに含まれている可能性があると示されることがあります。効率性は、速くて独立したハッシュ関数を使用することで得られます。代表的なものには、マーマーやFNVがあります。
ブルームフィルターのサイズ(ビット数)やハッシュ関数の数は、誤陽性率を調整するために変更できます。フィルターが大きいほど誤陽性は減少し、小さいほど増加します。また、要素の追加やメンバーシップの確認のパフォーマンスは、ハッシュ関数の数に直接関連しています。
ブルームフィルターは、データベースやネットワークシステムなど、迅速なメンバーシップテストが必要なさまざまなアプリケーションで役立ちます。要するに、ブルームフィルターは、効率的に集合のメンバーシップを判断するための強力なツールですが、誤りの可能性があるというトレードオフがあります。
46.eBPFで高速TCP指紋解析(Implementing fast TCP fingerprinting with eBPF)
この記事では、著者がGolangのウェブサーバーでeBPF(拡張バークレー・パケット・フィルター)を使用して高速なTCPフィンガープリンティングを実装した経験について述べています。TCPフィンガープリンティングは、ウェブリクエストにおける異常なトラフィックパターンを特定するのに役立ちます。これは、言語モデルのトレーニングのために増加するウェブスクレイピング活動に対するボット対策に特に関連しています。
この記事は二部構成になっています。第一部では、TCPフィンガープリンティングの背景情報とさまざまな実装戦略について説明しています。第二部では、クライアントのTCPフィンガープリンティングをエコーバックするプロトタイプのウェブサーバーの実際の開発について詳しく述べています。
主なポイントとしては、まずHTTPとTCPの基本について説明しています。著者は、C言語を用いた簡単な例を通じて、ウェブサーバーの動作やTCP接続プロセス、ネットワーキングの基本要素を詳しく解説しています。次に、TCP接続を確立するための三者間ハンドシェイクについて説明し、交換される情報がクライアントの特定にどのように役立つかを強調しています。
また、TCPデータの収集についても触れています。従来のAPIでは元のTCP SYNデータにアクセスする際の制限があることを指摘し、パケットをキャプチャするためのLibPCAPを紹介していますが、リアルタイム処理ができないという欠点も挙げています。さらに、eBPFを効率的なカーネル側処理の解決策として紹介し、追加のライブラリのオーバーヘッドなしでデータ構造を作成できる利点を説明しています。これにより、カーネル空間とユーザー空間の両方からアクセス可能なデータ構造が作成でき、プロジェクトにとって有利です。
この記事は、技術的なガイドとしてだけでなく、ネットワークプログラミングにおけるeBPFの使用方法の入門としても機能しており、TCPフィンガープリンティングデータを効果的にキャプチャするための利点を示しています。このプロジェクトはオープンソースで、GitHubで公開されています。
47.30億ドルの謎契約(Oracle signed $30B per year cloud deal with mystery customer)
あなたのコンピューターネットワークに異常な活動が見られました。続行するには、下のボックスをクリックしてロボットではないことを確認してください。
このメッセージが表示される理由は、ブラウザでJavaScriptとクッキーが有効になっているか、またそれらがブロックされていないかを確認するためです。
サポートが必要な場合は、サポートチームに連絡し、リファレンスID: d07e2b91-55cb-11f0-b0db-9648c5466976をお伝えください。
また、Bloomberg.comに登録すると、重要な世界の市場ニュースを受け取ることができます。
48.ブラッドのデジタル庭(Brad Woods Digital Garden)
ブラッド・ウッズのデジタルガーデンは、ウェブ開発やクリエイティブコーディングに関するノートや洞察を集めたものです。主なトピックには、スクロールに応じたアニメーション、3Dシーンでのカメラ移動や線画の作成技術が含まれています。
3D CSSでは、視点などのCSSプロパティを使って3D空間を構築する方法が紹介されています。WebGLシェーダーについては、シェーダーの機能やウェブ開発における重要性が説明されています。
ユーザーインターフェース(UI)デザインでは、ユーザー主導のUIやパーソナライズ、効果的な目次の作成といった概念が取り上げられています。JavaScriptとTypeScriptの基本についても触れられており、クラス、スコープ、パフォーマンス最適化、Reactにおける状態管理などが解説されています。
CSS技術では、ブレンドモードやフィルターの活用、アクセシブルなデザインの作成方法が紹介されています。ゲーム開発に関しては、ゲームの感触や感情的デザインについての洞察が得られます。
その他のトピックには、ブラウザの適応、動的ヘッダー、無限スクロール、効果的なウェブ開発のためのツールが含まれています。全体として、デジタルガーデンはウェブ開発の分野におけるクリエイティブなプロジェクトや技術的知識のリソースとして機能しています。
49.IPv4なしのネット利用(Using the Internet without IPv4 connectivity)
著者は停電の後、インターネットサービスプロバイダー(ISP)の問題でIPv4の接続が失われましたが、IPv6の接続は維持されました。そのため、多くのウェブサイトにアクセスできなくなり、著者はLinuxサーバー、WireGuard、VPSプロバイダーのHetznerを使って解決策を見つけることにしました。
問題の背景として、停電後に著者のISPがIPv4接続を提供できなくなり、IPv6は正常に動作していました。この問題は、ISPが使用しているキャリアグレードNAT(CG-NAT)に起因しており、これがIPv4サーバーへのアクセスを制限していました。
著者はHetznerのVPSを持っており、そこにはIPv4とIPv6の両方のアドレスがありました。著者はVPS上にVPNサービスであるWireGuardを設定し、IPv6接続を通じてIPv4トラフィックをトンネルすることにしました。
NAT(ネットワークアドレス変換)は、限られたIPv4アドレスのために複数のデバイスが1つのパブリックIPアドレスを共有できるようにします。CG-NATはISPレベルでさらに別のNATを追加し、直接接続を複雑にします。
IPv6の利点は、膨大な数のアドレスを提供するため、ほとんどの場合NATが不要になることです。しかし、すべてのウェブサイトがIPv6でアクセスできるわけではないため、IPv4トラフィック用のトンネルが必要です。
著者はWireGuardを設定し、IPv4とIPv6のトラフィックを処理できるようにしました。また、一部のパケットがドロップされる原因となったMTU(最大伝送単位)の問題にも対処しました。
仕事のVPNに接続するために、著者はネットワークネームスペースを使用してVPNトラフィックを隔離しました。ネットワークネームスペース内でDockerを実行しようとした際には課題が生じ、ネットワーク設定を管理するために創造的な解決策が必要でした。
この経験は、Linuxの柔軟性と自分のネットワーク設定を管理する利点を強調しています。著者は同様の問題に対処するためにVPSを使用することを推奨し、より良いネットワーク管理のためにOpenWRTのようなカスタマイズ可能なルーターへの投資を考えています。
全体として、この投稿はLinuxツールとサービスを使用してインターネット接続の問題を克服する実践的なアプローチを示しています。
50.MCP: 万能プラグインシステム(MCP: An (Accidentally) Universal Plugin System)
この記事では、モデルコンテキストプロトコル(MCP)について説明しています。このシステムは、USB-Cがさまざまな機能を持つのと同様に、さまざまなツールやデータソースを接続することを可能にします。もともとはAIアシスタントを強化するために設計されましたが、実際にはAI以外の幅広いアプリケーションにも利用できます。
著者はMCPをユニバーサル電源コンセントに例え、特定の統合を必要とせずに異なるサービスを接続することで多様な機能を実現できると述べています。これにより、アプリは既存のMCPサーバーを活用することで新しい機能を得ることができ、まるでポットラックで料理を共有するような仕組みが生まれます。
全体として、MCPはデジタルリソース間の接続を促進する柔軟なツールとして描かれており、ソフトウェアの相互作用を革命的に変える可能性を秘めています。これは、HTTPやBluetoothなどのプロトコルが元々の目的を超えて進化したのと同じです。また、著者はAPMというタスク管理アプリを開発中で、これもMCPサーバーを利用してユーザーのニーズに応じた機能を提供する予定です。
51.川のシミュレーション革新(Improving River Simulation)
2025年4月14日、JonathanCRはプログラムにおける河川シミュレーションの改善についての更新を共有しました。彼は古い機能を新しい構造に移行しながら、その精度を向上させています。以前の方法では、河川の流れを1月と7月だけ追跡していましたが、これは不十分でした。河川の流れは、地元の天候だけでなく、さまざまな場所の条件にも影響されるからです。
この問題に対処するため、彼はプログラムを更新し、12か月すべての河川の流れを監視できるようにしました。これにより、河川の流れの季節変化をより正確に描写できるようになりました。例えば、寒冷な砂漠にある河川は、北側の水源からの安定した降雨によって年間を通じて一定の流れを維持します。一方、別の河川は、ほとんどの年で水が少なく、夏の雪解け時に急激な流れの変化を経験します。
現在、このプログラムは年間を通じて河川のサイズを動的に表示できるため、シミュレーションがよりリアルで信じられるものになっています。
52.インラインCの魔法(Inline-C: Write inline C in Haskell)
inline-cは、Haskellプログラム内にCコードを簡単に組み込むためのツールです。これを使うことで、Cライブラリを呼び出したり、高性能なCコードをHaskellファイル内に直接書いたりすることができます。Foreign Function Interface(FFI)を必要とせず、レガシーコードや高性能ライブラリにアクセスするのに便利です。
主な特徴として、Haskell内でCの式や文をクォジ・クォーテーションを使って直接書くことができる点があります。また、HaskellとCはデータを最小限のオーバーヘッドで共有でき、両言語間でデータ型を自動的に変換します。さらに、Cの式やコードブロックを埋め込むことができ、Cコード内でHaskellの変数を参照することも可能です。
具体的な使用例として、C関数を呼び出す場合は、C.exp
を使います。例えば、x <- [C.exp| double{ cos(1) } |]
のように書きます。また、複数の文を含むCコードブロックを埋め込むには、C.block
を使用します。例えば、x <- [C.block| int { /* C code */ } |]
と記述します。Haskellの変数をCコード内で参照するには、アンチクォートを使います。例として、for (i = 0; i < $(int n); i++) { /* C code */ }
のように書けます。
コンテキストを定義することで機能を拡張し、カスタムC型やアンチクォーターをサポートすることもできます。特別なアンチクォーター(vec-len
やvec-ptr
など)を使うことで、HaskellのベクターやByteStringsをCでシームレスに扱うことができます。
ただし、現在のところinline-cはGHCiの解釈モードをサポートしていませんが、事前にコンパイルしたコードを読み込むために-fobject-code
フラグを使用することができます。
全体として、inline-cはHaskellアプリケーション内でCの性能を活用しつつ、クリーンで統合されたコーディングスタイルを維持するための強力な方法を提供します。
53.唾液避妊薬、欧州初承認(Europe approves first saliva-based contraceptive – no pill required)
新しい唾液を使った避妊デバイス「ミニラボ」がヨーロッパでの使用が承認されました。このデバイスはベルリンのスタートアップ企業インネによって開発され、自宅で使用できるテスト機器です。ミニラボはプロゲステロンのレベルを測定し、女性がホルモンに頼らずに自分の妊娠可能性を理解する手助けをします。
300人の女性を対象にした臨床試験では、ミニラボは完璧に使用した場合に100%の効果を示し、通常の使用では92%の効果がありました。これはプロゲステロンピルと同等で、コンドームよりも効果的です。従来のホルモンを使った方法とは異なり、ミニラボは体重増加や偏頭痛といった副作用を軽減することを目指しています。
ユーザーは特別なストリップに唾液を塗布し、それをデバイスが分析してホルモンの健康状態や妊娠可能性についての情報を提供します。ミニラボは現在ドイツとオーストリアで入手可能で、イギリスでの発売も計画されています。月額24ユーロからのサブスクリプションモデルで提供されます。
インネの創業者であるエイリニ・ラプティ氏は、このデバイスが女性に健康管理のコントロールを与え、パターン認識に依存する既存の方法に代わる信頼できる選択肢を提供することを強調しています。
54.Scientists Retrace 30k-Year-Old Sea Voyage, in a Hollowed-Out Log(Scientists Retrace 30k-Year-Old Sea Voyage, in a Hollowed-Out Log)
要約がありません。
55.Error handling in Rust(Error handling in Rust)
要約がありません。
56.バイリンガルの脳力(Is being bilingual good for your brain?)
多くの研究が、複数の言語を知ることの利点を強調しています。多言語を話すことはコミュニケーションを助けるだけでなく、集中力や計画力、新しい情報への適応力などの精神的なスキルを向上させると考えられています。興味深いことに、研究によると、バイリンガルの人々は、単一言語を話す人々よりも約4年遅れて認知症を発症する可能性があるとされています。しかし、一部の研究ではこれらの結果を確認できていないため、専門家たちは多言語使用の利点が本当に存在するのか、またそれが何を意味するのかについて疑問を抱いています。
57.AI法案、10年凍結の危機(Congress might block state AI laws for a decade)
連邦政府が提案している新しい法案は、州や地方自治体が人工知能(AI)を規制することを今後10年間禁止する内容です。この提案は、テッド・クルーズ上院議員や他の議員たちの支持を受けており、アメリカが中国と競争する中で規制を簡素化し、イノベーションを促進することを目的としています。支持者たちは、州の規制が混乱を招く「パッチワーク」を生み出し、進展を妨げていると主張しています。
一方で、批判者たち、特に多くの民主党員や一部の共和党員、消費者擁護団体は、このモラトリアムが消費者をAIに関連する危害から守られなくなる可能性があり、大手AI企業に過剰な権力を与えると警告しています。17人の共和党知事のグループは、予算案からこの条項を削除するよう上院の指導者に求めています。
このモラトリアムは、AI企業に対してトレーニングデータの開示を求める州の法律や、誤解を招くAI生成コンテンツに対する規制など、消費者を保護する既存の州法を覆す可能性があります。批判者たちは、連邦政府がAI規制を作成するのが遅れている間、州が差別やプライバシー侵害といった具体的な問題に積極的に取り組んできたと指摘しています。
この提案が予算案に含まれることは、モラトリアムの遵守を連邦のブロードバンド資金に結びつける修正によって複雑化しており、州の権利に対する懸念が高まっています。一部の共和党員と民主党員は、この措置に反対するために協力しており、州の保護の重要性を強調しています。
一般の意見もAIの規制を求める方向に傾いており、多くのアメリカ人が政府がAI開発の安全性を確保するために十分な対策を講じていないことを心配しています。上院はこの提案について間もなく議論し、投票を行う予定であり、さまざまな政治派閥からの強い反対が予想されています。
58.シャープ比計算機(Sharpe Ratio Calculation Tool)
私は、過去の変動を示すシンプルなシャープレシオ計算機を作成しました。他の指標として、カルマーレシオやソルティーノレシオも含めるべきでしょうか。
59.Summle – A little maths Game(Summle – A little maths Game)
要約がありません。
60.Personal care products disrupt the human oxidation field(Personal care products disrupt the human oxidation field)
要約がありません。
61.DERをシリアル化する?(So you want to serialize some DER?)
この文章では、RustライブラリにおけるDER(識別されたエンコーディング表現)のシリアル化最適化のプロセスについて説明しています。
まず、ASN.1とDERについて触れます。ASN.1はデータ構造を記述するための表記法であり、DERは特定のバイナリエンコーディングフォーマットです。これらはしばしば混同されますが、異なるものです。
次に、シリアル化の課題について説明します。DERはタイプ・長さ・値(TLV)構造を使用しており、値の長さが変動するため、シリアル化が複雑になります。
初期のアプローチでは、Rustライブラリはシリアル化中に値の長さのためのスペースを確保していましたが、予想以上に大きな値があると非効率なコピーが発生する可能性がありました。
著者は、値が事前に長さを指定できるようにすることで効率を向上させ、不要なコピーを減らすことを目指しました。
整数型の長さ計算についても探求し、より複雑ですが、潜在的に高速な実装を実現しました。
さらに、著者はAI(Claude)を活用してコードの最適化を行いました。AIが提案した効率的な解決策には驚かされ、形式的なツール(Alive2)を使って検証しました。
結果として、著者はLLVMに対して最適化のためのプルリクエストを成功裏に作成し、AIと形式的検証を組み合わせることでコンパイラの最適化を向上させることができることを示しました。
この経験から、著者はAIが複雑なプログラミングタスクを解決する可能性や、現代の開発においてもコンパイラの最適化が必要であることを強調しました。また、AIが生成した解決策の品質を確保するためにレビューの重要性も指摘しました。
全体として、この文章はデータシリアル化とコンパイラ最適化の文脈で、AIを活用してソフトウェア開発プロセスを改善する実践的な例を示しています。
62.A rare asteroid flyby will happen soon, but NASA may be left on the sidelines(A rare asteroid flyby will happen soon, but NASA may be left on the sidelines)
要約がありません。
63.Magnetic Tape Storage Technology: usage, history, and future outlook(Magnetic Tape Storage Technology: usage, history, and future outlook)
要約がありません。
64.ユーザーの秘密(What LLMs Know About Their Users)
アメリカの民主主義への信頼が低下しており、人口のほぼ半数が選挙の公正性に疑問を抱いています。この問題は、投票に使用されるデジタルシステムへの信頼の欠如によってさらに悪化しています。技術の進歩により投票は効率的になりましたが、同時に誤情報や恐怖が広がる複雑さも生まれました。
最近の研究によると、サイバー攻撃に関するニュースに触れることで、特にデジタル機器を使って投票したばかりの有権者の間で選挙への信頼が低下することがわかっています。勝者と敗者の支持者の両方が、こうした攻撃について聞くと懐疑的になる傾向があります。
選挙に対する公衆の信頼を維持するためには、有権者に選挙の実施方法やその安全性について教育することが重要です。信頼は国家の資産として築き、守るべきものと考えるべきです。サイバー脅威はインフラに関する問題だけでなく、社会の結束を損ない、民主的な制度への信頼を揺るがすものです。最終的には、人々が自分の投票が重要であると信じることが、民主主義の健全性にとって不可欠です。
65.Community Is Motivation on Tap(Community Is Motivation on Tap)
要約がありません。
66.ノルウェー宝くじ大混乱(Thousands in Norway told they had won life-changing sums in lottery error)
ノルウェーの国営ギャンブル会社、ノルスク・ティッピングが誤って多くの人々にユーロジャックポット宝くじで大金を当選したと伝えた問題が発生しました。この誤りは、賞金額をユーロからノルウェークローネに換算する際に、手動のコーディングミスが原因で、金額が割り算されるべきところを100倍にされてしまったことによります。この問題を受けて、CEOのトーニェ・サグスチュエンが辞任し、顧客や規制当局、ノルウェーの文化大臣から批判を受けました。誤った賞金額はオンラインで表示されましたが、実際には支払いは行われませんでした。多くの人々が当選を祝っていたものの、誤りに気づくまで時間がかかりました。ノルスク・ティッピングはこの事件を調査中で、過去にも同様の技術的問題を経験しています。
67.ハスケルでパスポート申請解決!(Solving `Passport Application` with Haskell)
この記事では、イギリスで人気のオンラインゲーム「パスポート申請」について紹介しています。このゲームは、英国のパスポートオフィス(HMPO)が制作したもので、英国のパスポートを取得するための複雑な手続きをシミュレーションしています。プレイヤーは、英国市民であることを証明するためにさまざまな書類を集める必要があります。
ゲームの概要は、テキストベースのアドベンチャーパズルで、プレイヤーは数週間または数ヶ月にわたって書類を集め、複雑な官僚的ルールに従って自分の英国性を証明します。
書類の要件としては、英語以外の書類には翻訳が必要で、時には家族を巻き込むこともあります。ゲームには、特定の職業からの身分証明などのサイドクエストも含まれており、プレイヤーはHMPOからの混乱した書類の要求に直面することがよくあります。
ゲームの論理は「官僚的論理」に影響されており、プレイヤーは単に証拠を提供するのではなく、市民権の証明を構築する必要があります。著者は、Haskellを使ってゲームのルールをコーディングする実験を行い、書類の要件の背後にある論理を理解しようとしました。必要な書類の完全なリストを作成し、それぞれの理由を探ることを目指しました。
このプロセスは、先祖からの書類の再帰的な要求を含むことがあり、英国の国籍法の複雑さを反映しています。著者は、自分の娘のためにプレイした経験を共有し、ゲームを通じてさまざまな課題や書類の要求に直面したことを語っています。
全体として、この記事は官僚的なプロセスをナビゲートする際のユーモアとフラストレーションを組み合わせ、著者のプログラミングの旅を通じてゲームのルールを解読する様子を強調しています。
68.Schizophrenia is the price we pay for minds poised near the edge of a cliff(Schizophrenia is the price we pay for minds poised near the edge of a cliff)
要約がありません。
69.The Unsustainability of Moore's Law(The Unsustainability of Moore's Law)
要約がありません。
70.A18プロチップ搭載新MacBook発見!(New MacBook with A18 Pro Chip Spotted in Apple Code)
Appleは、新しいMacBookの開発を進めており、iPhoneに通常搭載されているA18 Proチップを使用する予定です。この情報は、MacRumorsが発見したコードやアナリストのミン・チー・クオの報告に基づいています。新しいMacBookは、13インチの画面を持ち、シルバー、ブルー、ピンク、イエローなどの色で展開される見込みです。これは、従来のMシリーズチップではなく、iPhoneのチップを初めて搭載するMacとなります。A18 Proチップは、iPhone 16 Proとともに発表されました。この新しいMacBookの生産は2025年の後半か2026年の初めに始まると予想されており、来年の前半に発売される可能性があります。
71.フライトの旅路を可視化(I'm an airline pilot – I built interactive graphs/globes of my flights)
著者は、パイロットが飛行時間を記録する必要があることから、デジタルで飛行時間を追跡する経験を共有しています。彼らは、自分の飛行履歴を表示するためにデータの視覚化や3Dの地球儀を作成しました。特にお気に入りの地球儀はリンクで紹介されています。さらに、データを表示するためのグラフのアイデアや方法についての提案を募っています。
72.ゼロトラストの新常識(Zero Trust for Bring Your Own Cloud (BYOC))
「自分のクラウドを持ち込む」(BYOC) モデルは、プライバシーやコンプライアンスのために顧客のクラウドでプラットフォームをホストする必要がある企業にとって重要になっています。最近の研究では、安全なBYOCモデルの構築に焦点が当てられており、何が安全なBYOCを定義するのかという疑問が生じています。
調査の結果、多くの企業がBYOCの提供においてゼロトラストの原則を緩やかに採用しているものの、ゼロトラストBYOC(ZTB)モデルの明確な定義が欠けていることがわかりました。ゼロトラストは、常に相互作用を確認し、暗黙的に信頼しないことを強調しており、安全なアクセスとデータ管理にとって不可欠です。
ゼロトラストとして認められるためには、BYOCモデルは以下の重要な原則を含むべきです。
データプレーンの分離:顧客データはそのクラウドアカウント内に留まり、コンプライアンスを確保しリスクを最小限に抑える必要があります。プルベースのコントロールプレーン通信:顧客がすべての通信をベンダーに対して開始することで、不正アクセスを防ぐべきです。コンポーネントレベルのゼロトラスト:すべてのコンポーネントが互いに認証と承認を行い、ネットワークの位置に基づく信頼を防ぐ必要があります。最小権限アクセス:システム、ユーザー、自動化は最小限のアクセス権を持つべきで、資格情報の悪用によるリスクを減少させます。どこでも暗号化:すべての通信は暗号化され、データを保護し、規制に準拠する必要があります。
これらの原則を実施することで、顧客のクラウド内でサービスが運営される環境において信頼と安全性が育まれます。著者たちは、このフレームワークが他者が最初から安全なシステムを設計する手助けになることを期待しています。
73.40行でJSON解析(Parsing JSON in Forty Lines of Awk)
この記事では、Unixシェルで利用できるプログラミング言語AWKを使ってJSONを解析する方法について説明しています。JSONは階層構造を持っているため、シェルで扱うのが難しいことがあります。jqのようなツールもありますが、これらは追加の依存関係を必要とします。著者は、JSONを読み取る必要がある動作するシェルスクリプトを持っていたため、AWKでシンプルなJSONパーサーを作成することにしました。
主なポイントは以下の通りです。まず、JSONの構造は文字で分割するのが難しく、形式が正しくないとエラーが発生する可能性があります。次に、パーサーはJSONドキュメントとキーのパスを受け取り、対応する値を返す単一の関数で構成されています。このパーサーはオブジェクトと配列の両方を処理できます。
実装の詳細としては、パーサーはループや条件を使ってJSON構造をナビゲートし、JSON文字列をデコードするための関数も用意されています。また、解析中の問題を管理するためにカスタムエラーファンクションも含まれています。
このパーサーは簡潔で、たった40行のAWKコードで効果的にJSONを解析できることを示しています。
74.We ran a Unix-like OS on our home-built CPU with a home-built C compiler (2020)(We ran a Unix-like OS on our home-built CPU with a home-built C compiler (2020))
要約がありません。
75.ラゴが10職募集!(Lago (Open-Source Usage Based Billing) is hiring for ten roles)
Lagoでは、さまざまな職種の採用を行っています。彼らは、自分の仕事に対してスキルと情熱を持った候補者を求めています。求人は異なる部門での役割を含む可能性があり、応募者は詳細情報をウェブサイトで確認できます。興味のある方は、具体的な職務要件をチェックし、資格を満たしている場合は応募してください。
76.More on Apple's Trust-Eroding 'F1 the Movie' Wallet Ad(More on Apple's Trust-Eroding 'F1 the Movie' Wallet Ad)
要約がありません。
77.中流音楽家の死(The Death of the Middle-Class Musician)
ルク・リナルディの「中流階級の音楽家の死」という記事では、現代の音楽家が直面している課題について述べられています。音楽を作ることは容易になった一方で、それを生計にすることはますます難しくなっています。
多くのアーティスト、例えばロリー・ペンバートン(通称ケイデンス・ウェポン)は、ある程度の名声を得ているにもかかわらず、経済的な困難に直面しています。彼らは音楽からの収入が不十分なため、副業や助成金に頼ることが多いです。
アーティストは通常、レコード会社と不利な契約を結び、収入の大部分を奪われます。Spotifyのようなストリーミングサービスの普及により、アーティストは1再生あたりの収入が非常に少なく、音楽から収益を上げるのが難しくなっています。
COVID-19パンデミックは音楽家の状況をさらに悪化させ、ツアーが難しくなり、経費が増加しました。多くのアーティストは、ツアーが利益を生まないと感じています。
経済的なプレッシャーは音楽家のメンタルヘルスにも影響を与え、高い不安やうつ病の報告が見られます。
音楽産業は経済において重要な役割を果たしており、多くの雇用や地域ビジネスを支えています。しかし、アーティストが生計を立てられないと、文化全体のエコシステムが損なわれます。
音楽業界の運営方法において、政府からのより良い支援やストリーミングサービスからの公正な扱い、アーティストの独立性を重視する必要があるとの声が上がっています。
ペンバートンのようなアーティストたちは、公正な商品販売やアーティストが直面する苦労への理解を深めるための改善を求めています。
この記事は、アーティストの生活を支え、音楽が文化的な力として持続可能であるために、音楽業界の改革が急務であることを強調しています。
78.Goで作るLuaインタプリタ(Why Go Rocks for Building a Lua Interpreter)
ロクシー・ライトは、Goを使ってカスタムLuaインタープリタを構築した経験を共有しています。彼女は既存のLuaインタープリタが自分のニーズに合わないと感じ、数ヶ月にわたるプロセスを楽しみました。
Luaは動的型付けのプログラミング言語で、nil、ブール値、数値、文字列、テーブル、関数などのデータ型を持っています。Luaのコードは関数に解析され、グローバル変数に対する操作は特別なテーブルである_ENV
を通じて管理されます。
インタープリタは、Luaコードをトークン化するlualex
、解析して実行可能な命令を生成するluacode
、命令を実行するlua
の3つのGoパッケージで構成されています。luacode
のパーサーは抽象構文木を生成するのではなく、直接命令を生成するため、効率的な実行が可能です。
Goのインターフェース型はLuaの値を効果的に表現します。インタープリタはGoの型を使ってLuaの型を実装し、数値変換や関数処理などの操作を可能にしています。
Luaコードは、インタープリタが実行する命令のシーケンスに変換され、スタックベースのモデルを使用します。これにより効率的な処理や定数畳み込みなどの最適化が実現されます。
Goを使用する利点として、組み込みのガーベジコレクション、型、標準ライブラリがあり、PUC-Rio Luaと比べてインタープリタの設計が簡素化され、テストやメンテナンスが容易になりました。
主な課題には、エラーハンドリングの再考、特定のライブラリの移植、Luaのガーベジコレクタをホストプログラムが停止しないように管理することが含まれました。また、元のLuaテストスイートは依存関係のために困難をもたらしました。
このプロジェクトは非常に充実したものであり、ライトはインタープリタをスタンドアロンのパッケージではなく、彼女のzbプロジェクトの一部として保持する予定です。彼女はこのようなプロジェクトにおけるGoの生産性の利点を強調し、今後さらに洞察を共有する意向を示しています。
全体として、ライトの経験は、Goの機能がLuaインタープリタの開発をどのように向上させ、関わる複雑さに対処できるかを示しています。
79.アマゾンからの脱却(Unhooking from Amazon Ebooks)
著者は、電子書籍の購入においてAmazonから離れる過程を共有しています。特に、Kindle書籍からEPUB形式への移行に焦点を当てています。著者は、さまざまな電子書籍フォーマットを読むことができるカスタム電子リーダーアプリ「KOReader」を使用するために、Kindleを脱獄しました。脱獄のプロセス自体はそれほど難しくはありませんでしたが、KOReaderのユーザーインターフェースは最初は混乱を招くものでした。
著者の主な目標は、Amazonを支援することなく電子書籍を購入することですが、新しい書籍の同期や購入した書籍からDRM(デジタル著作権管理)保護を解除することに苦労しました。Calibreを使ってこのプロセスを自動化する方法を探りましたが、手間がかかることが分かりました。
これらの努力にもかかわらず、著者はAmazonが電子書籍市場に強い影響力を持っていることを認めています。多くの場合、ユーザーは購入のためにAmazonのプラットフォームに誘導されます。また、Amazonの頻繁な割引の魅力や、DRMのないフィクションを他で見つけることの難しさにも言及しました。
全体として、この経験は困難であまり便利ではありませんでしたが、著者は将来的により簡単な解決策を期待しています。
80.設計された依存(Engineered Addictions)
ソーシャルメディアプラットフォームには、さまざまな課題や腐敗が存在しています。より良い代替手段を作ろうとする試みは、同じ欠陥のある経済構造の中で運営されるため、しばしば失敗に終わります。著者は、Circliqというソーシャルプラットフォームを立ち上げた創業者であり、既存のソーシャルメディアの中毒性や、これらのプラットフォームが真のつながりからユーザーのエンゲージメントや利益を優先するように進化していく過程を振り返っています。
新しいソーシャルプラットフォームであるBeRealやClubhouseは、良い意図から始まりましたが、成長や資金調達を求める過程で腐敗し、つながりよりもユーザー数に焦点を移してしまいました。著者は、ソーシャルメディアの中毒は個人の弱さだけでなく、システム全体の問題であると主張しています。ユーザーは、彼らを引きつけ続けるように設計されたアルゴリズムによって操作されています。
ソーシャルメディアの普及は、特に若い世代において不安や抑うつの増加と相関しています。彼らは常に比較され、情報の過負荷に苦しんでいます。この問題を解決するためには、単に新しいアプリを作るのではなく、ソーシャルメディアの資金調達や構造を再考する必要があります。具体的には、ユーザーの幸福を優先する異なる資金モデルの導入や、依存性を減らすためのアルゴリズムの規制、ユーザーのエンゲージメントではなく、関係の質で成功を測ることが提案されています。
著者は、利益追求型のプラットフォームの外で真のつながりを育む環境を作ることを提唱しています。人間の相互作用を支えるシステムを目指すことが重要です。ソーシャルメディアの問題に対処するためには、エンゲージメントや利益ではなく、つながりや幸福に焦点を当てた経済的インセンティブを変える必要があります。
81.飲まない1000日(1000 Days Without Drinking)
著者は、1000日間の禁酒を達成したことに対して達成感を感じています。彼は、そもそも飲み始めたことを後悔しており、飲酒が一般的に持たれる社交的な利点をもたらさなかったことに気づきました。彼は、自分の目標を追求する代わりに、飲酒に多くの時間を無駄にしたと考えています。著者は、過去の問題からの真の癒しは、人がその問題に影響を受けていたことを本当に忘れたときに始まると理論づけています。彼は、自分の過去の行動を認めることはできるものの、その背後にある論理にはもはや共感できないと述べています。著者は、より良い未来を築くためには、過去を乗り越えることの重要性を強調しています。
82.地球、熱を超過蓄積!(Earth is trapping much more heat than climate models forecast)
最近の研究によると、地球は気候モデルが予測していたよりもはるかに多くの熱を蓄えていることが明らかになりました。過去20年間でエネルギーの蓄積速度は2倍になり、現在の地球のエネルギーバランスは、2000年代中頃の約0.6ワット毎平方メートル(W/m²)から約1.3 W/m²に増加しています。
このエネルギーの不均衡は、今後数年で気候変動が加速する可能性を示唆しており、熱波や干ばつ、激しい降雨などの極端な気象現象が増えることが予想されます。余分な熱のほとんどは海洋によって吸収されており、陸地を温めたり氷を溶かしたりするのはごくわずかです。
研究者たちは、衛星測定や海洋温度のデータを用いてこのエネルギーの不均衡を追跡しています。また、特に反射率の高い雲の減少が、熱の保持の急激な増加に寄与している可能性もあります。
これらの結果は、最近の極端な気温が孤立した出来事ではなく、地球温暖化の長期的な傾向の一部であることを示しています。化石燃料の使用を減らし、気候変動を効果的に監視するための緊急の行動が求められており、特に衛星監視の資金が不確実性に直面している中での対応が重要です。
83.自動行動モデルの未来(WorldVLA: Towards Autoregressive Action World Model)
WorldVLAは、行動理解と画像生成を一つのシステムに統合した新しいモデルです。このモデルは、視覚と言語、行動を組み合わせたVLAモデルと、世界モデルを組み合わせています。世界モデルは、行動と画像を使って未来の画像を予測し、環境をよりよく理解することで行動生成を改善します。同時に、行動モデルは見たものに基づいて行動を生成し、視覚理解と画像生成の両方を強化します。
WorldVLAは、別々の行動モデルと世界モデルよりも優れた性能を示しており、これらが互いに改善し合うことを示しています。しかし、行動モデルは、行動の順序を生成する際に苦労することがあり、以前の行動の誤りが後の行動に影響を与えることがあります。この問題を解決するために、現在の行動を生成する際に一部の以前の行動を隠す注意マスク戦略を導入しました。このアプローチにより、行動のシーケンス生成の性能が向上しました。
84.ガザの食糧配布で発砲命令(IDF officers ordered to fire at unarmed crowds near Gaza food distribution sites)
イスラエルの兵士たちは、過去1ヶ月間にわたり、ガザで人道的支援を待っている無防備なパレスチナ人に対して、軍が意図的に発砲したと報告しています。この行動は、紛争地域における民間人の扱いについて深刻な懸念を引き起こしています。
85.人細胞の謎の構造(Previously Unknown Structure Hiding Inside Human Cells)
科学者たちは、人間の細胞に新しい細胞小器官「ヘミフュソーム」を発見しました。この小器官は細胞内の物質をリサイクルする役割を果たしています。この発見は、バージニア大学と国立衛生研究所の研究者によって行われ、ヘミフュソームが細胞が内容物を管理し処理する上で重要な役割を果たしていることを示唆しています。この構造は一時的で、必要なときにのみ現れるため、これまで特定するのが難しかったのです。
先進的な画像技術を用いて、研究者たちはヘミフュソームが小胞、つまり細胞内で物質を運ぶ小さな袋を形成するのを助けることを発見しましたが、外部の物質を細胞が吸収する過程であるエンドサイトーシスには関与していません。ヘミフュソームは特定の細胞領域、特に細胞膜の近くに多く見られますが、どのように形成されるのか、また機能不全が起きた場合に何が起こるのかについては、まだ研究が続けられています。ヘミフュソームの理解が進むことで、細胞内の物質処理に関連する遺伝性疾患の新しい治療法につながる可能性があります。
86.AGL: Goに変わるおもちゃ言語(AGL a toy language that compiles to Go)
ここ二週間で、私はシンプルなプログラミング言語を作りました。Go言語のスキャナーとパーサーを改良し、関数が一つの値だけを返すようにしました。この変更により、結果やエラーの処理がより簡単になりました。また、型を自動的に推論する短い匿名関数も追加しました。これにより、Map、Reduce、Filterなどの関数を長い型指定なしで使いやすくなりました。
87.DuckDBとR2で超お得データ解析(Using DuckDB WASM and Cloudflare R2 to host and query big data (for almost free))
DuckDB WASMとCloudflare R2を利用して、大規模なデータセットをホスティングし、クエリを実行する方法について説明しています。特に、1億5000万行(約72GB)のデータを扱う際に、従来のSQLデータベースはコスト面で効率的ではないことが指摘されています。そのため、Cloudflare R2にデータを静的ファイルとしてホスティングし、DuckDB WASMでクエリを実行する方が良い解決策だと提案されています。この構成では、サーバーを必要とせず、クライアント側のマシンがデータのクエリと表示を行います。
重要なポイントとして、Cloudflare R2はデータの取り出しに対する料金が発生しないため、大量のデータを扱う際に経済的であることが挙げられます。72GBのデータをホスティングする年間の総コストは、ドメインとストレージを含めて約23ドルと見積もられています。この構成は、多くのユーザーや大規模なデータセットへのスケーリングが容易です。また、ユーザーはクライアント側でダッシュボードやグラフィックスを作成できるため、追加のサーバーコストなしでインタラクティブ性が向上します。
著者は、R2で複数のファイルパーティションをクエリする際の制限についても言及しており、S3の機能と比較しています。全体として、このアプローチは大規模なデータセットを効率的かつ低コストで管理し、公開する方法として紹介されています。
88.Memory Safe Languages: Reducing Vulnerabilities in Modern Software Development [pdf](Memory Safe Languages: Reducing Vulnerabilities in Modern Software Development [pdf])
要約がありません。
89.ラズパイラジオ2(Raspberry Pi Radio Module 2)
ラズベリーパイラジオモジュール2が4ドルで販売開始されました。このモジュールは、Wi-FiとBluetoothの無線モジュールで、ユーザーが無線製品を作る際に、無線部品の再認証を必要としません。このモジュールはラズベリーパイピコWと同じ無線を使用しており、RP2040やRP2350を基にした製品との統合が容易に行えるように設計されています。
主な特徴としては、外部部品が少なく、コンパクトなサイズ(16.5mm x 14.5mm)を持っています。また、2.4GHzのアンテナが内蔵されており、接続インターフェースもシンプルです。完全なモジュール認証を受けているため、高額な無線認証プロセスを避けることができます。Wi-Fi 4(802.11n)とBluetooth 5.2をサポートしており、アンテナを共有しても強力なパフォーマンスを発揮します。
このモジュールはラズベリーパイピコSDKやMicroPythonと互換性があり、開発者にとって使いやすいです。すでにSparkFunやPimoroniなどのパートナー製品に組み込まれています。
90.LLM API 比較ツール(A tool to benchmark LLM APIs (OpenAI, Claude, local/self-hosted))
私は、OpenAIやClaude、そして自分でホストするモデルであるllama.cppなど、さまざまな言語モデル(LLM)APIエンドポイントをテストし比較するための小さなオープンソースツールを作成しました。このツールは、一定数のテストを実行し、2つの重要な指標を提供します。
1つ目は「ファーストトークン遅延(ms)」で、これは最初の応答が返ってくるまでの時間です。2つ目は「出力速度(トークン/秒)」で、モデルがテキストを生成する速さを示します。
このツールのデモはここで見ることができ、コードはここにあります。
このツールの目的は、さまざまなLLMプロバイダーの性能を視覚的かつ一貫して評価しやすくすることです。特に、安価なサードパーティサービスも含まれています。対応しているのは以下の通りです。
- OpenAI互換のAPI(公式およびプロキシ)
- Anthropicを通じたClaude
- ローカルまたは自己ホスト型のモデル
また、docker-composeを使用してツールを自己ホストすることも可能で、新しいプロバイダーの追加も簡単です。フィードバックやプルリクエスト、テストレポートを歓迎します。特にあまり知られていないサービスについての情報をお待ちしています。
91.愛用ツール:ミゼンプラス(Tools I love: mise(-en-place))
Miseは、特にさまざまなプログラミング言語を使用する開発者向けに、ソフトウェアのインストールと管理を簡素化する強力なツールです。既存のバージョン管理やパッケージ管理ツールであるasdfやnvmと統合されており、環境変数の管理やタスクの実行が容易になります。
Miseの主な特徴には、まず簡単なインストールがあります。コマンドmise use <tool>
を使うことで、ツールを迅速にインストールできます。また、特定のプロジェクトに対して異なるツールのバージョンを管理するために、mise.tomlという設定ファイルを使用します。これにより、異なるディレクトリで異なるソフトウェアのバージョンを持つことが可能です。
さらに、mise.tomlファイルで特定のツールのバージョンを定義できるため、チーム全員が正しいバージョンを使用することが保証されます。継続的インテグレーションや継続的デプロイメント(CI/CD)パイプラインにおいても、開発環境とビルド環境の一貫性を保つために有利です。一般的な操作(インストールやテストなど)をタスクとしてmise.tomlに宣言することができるため、すべての開発者が統一して実行しやすくなります。
ただし、ソフトウェアの依存関係管理や、バイナリに悪意のあるコードが含まれる可能性についての懸念もありますので、miseを使用する際には注意が必要です。
全体として、miseはソフトウェア管理を効率化し、プロジェクト間の一貫性を確保することで生産性を向上させるツールです。
92.整数は浮動小数点ではない(Most ints are not floats)
この記事では、コンピュータシステムにおける整数と浮動小数点数の違いについて説明しています。以下に要点を簡潔にまとめます。
整数(int32およびint64)は、ゼロを含む全ての整数を表すことができる一方で、浮動小数点数(float32およびfloat64)は実数を表すことができますが、全ての整数を正確に表現できるわけではありません。
32ビット整数(int32)は、-2,147,483,648から2,147,483,647までの数値を表すことができます。しかし、ほとんどのint32の値はfloat32(32ビット浮動小数点数)として正確に表現できません。正確に表現できるのは約3.5%の値だけです。
64ビット整数(int64)は、さらに大きな数値を表すことができます。int32と同様に、int64の値のうち正確にfloat64(64ビット浮動小数点数)として表現できるのは約0.5%です。
Pythonでは、整数のサイズに制限がなく、無限大の整数を扱うことができますが、浮動小数点数はfloat64であるため、一部の大きな整数は浮動小数点数に収まらない可能性があります。
要するに、整数は実数として扱われることがありますが、コンピュータシステムではほとんどの整数が浮動小数点数として正確に表現されることはありません。
93.ZeroRISC Gets $10M Funding, Says Open-Source Silicon Security Inevitable(ZeroRISC Gets $10M Funding, Says Open-Source Silicon Security Inevitable)
要約がありません。
94.子どもとスマホの新研究(An Important New Study on Phones and Kids)
最近の研究「スマートフォンとソーシャルメディアの使用が青少年のメンタルヘルスに与える潜在的な悪影響に関する合意声明」では、スマートフォンが子供に与える影響について重要な発見が報告されています。さまざまな分野の研究者が集まり、このテーマに関連する26の主張を評価しました。
研究の主なポイントは次の通りです。まず、いくつかの西洋諸国では、過去20年間に青少年のメンタルヘルスが悪化していることが挙げられます。また、スマートフォンやソーシャルメディアの使用と、注意力の問題や行動依存症などの問題との間に関連性があることが示されています。特に若い女の子においては、ソーシャルメディアの使用が身体への不満、完璧主義、メンタルヘルスの問題、さらには性的嫌がらせのリスク増加と関連していることが指摘されています。
専門家たちの合意は、スマートフォンやソーシャルメディアが子供、特に女の子にとって有害である可能性があるということです。具体的な政策解決策についての合意は少なかったものの、多くの専門家はソーシャルメディアに対する年齢制限が有益であると考えています。
この研究は、これらの問題を研究することの複雑さにもかかわらず、技術が若者に与える悪影響について強い合意があることを強調しています。これにより、子供たちの幸福を促進するために、特定のアプリやインターネットへのアクセスを制限するなどの予防策が必要であることが示唆されています。
要するに、証拠はスマートフォンやソーシャルメディアの潜在的な危害から子供を守るための行動を取ることを強く支持しています。
95.UV-C光が殺せない生物(UV-C light kills nearly everything–except this unusual organism)
研究者たちは、Clavascidium lacinulatumという種類の地衣類が、通常はほとんどの生物に致命的なUV-C放射線の極端なレベルに耐えられることを発見しました。この地衣類はモハーヴェ砂漠で見つかり、科学者たちはその暗い色が日差しの強い環境での耐久性を助けていると考えています。実験室でのテストでは、火星で見られるUV-Cの20倍の高い量にさらされた際、約半分の藻類細胞が3ヶ月後も生存し、一部は繁殖さえしました。
この地衣類の耐久性は、外層に含まれる特別な化合物によるもので、日焼け止めのような役割を果たしています。興味深いことに、これらの化合物はUV-C放射線からの保護のためではなく、酸素の有害な影響から地衣類を守るために進化した可能性が高いとされています。というのも、UV-Cを遮るオゾン層は、地衣類が最初に進化した時には存在していなかったからです。
この発見は、高い放射線レベルを持つ他の惑星での生命の可能性について疑問を投げかけます。もし他の場所に生命が存在するなら、同様の保護適応を持っているかもしれないということを示唆しています。全体として、この研究は、惑星が居住可能かどうかという点から、極端な条件下で生命がどのように生存できるかを理解することに焦点を移しています。
96.コンテキスト工学入門(Context Engineering: A first-principles handbook with the latest research)
コンテキストエンジニアリングは、モデルのパフォーマンスを向上させるために、適切な情報を提供することに焦点を当てています。これは、個々の指示に注目するプロンプトエンジニアリングを超え、記憶やツール、制御フローを含む広範なコンテキストを考慮に入れています。
コンテキストエンジニアリングは、プロンプトを取り巻くすべての側面を最適化し、モデルのガイダンスや思考プロセスを改善します。プロンプトエンジニアリングが人気である一方で、実際の効果は全体のコンテキストを管理することから生まれます。このアプローチは、意味が特定のコンテキスト内での相互作用から生じるという考えに基づいています。
リポジトリの構成は、基本的なコンテキストとその要素、コンテキストエンジニアリングを実装するための実践的なチュートリアル、コンテキスト管理のための再利用可能な構造、実際のアプリケーションを示す例、詳細な文書や評価基準を含む参考資料から成り立っています。
学習成果としては、コスト効率の良いコンテキスト使用のためのトークン予算の理解、パフォーマンス向上のための少数ショット学習の実装、一貫した相互作用のための記憶システムの構築、事実に基づいた応答を得るための検索手法の利用、制御フローを通じた複雑なタスクの管理が含まれます。
このプロジェクトはコミュニティの参加を促し、貢献のためのガイドラインを提供しています。また、リポジトリはMITライセンスの下で利用可能です。このガイドは、すべてのレベルの学習者を対象にしており、コンテキストデザインにおける実践的な応用と反復的な改善を強調しています。
97.Continuous Glucose Monitoring(Continuous Glucose Monitoring)
要約がありません。
98.Vet – A tool for safely running remote shell scripts(Vet – A tool for safely running remote shell scripts)
要約がありません。
99.ビジービーバーの巨大さ(BusyBeaver(6) Is Quite Large)
レイモンド・ラフラム(1960-2025)は、最近のビジービーバー数、特にBB(6)の進展について考察しています。BB(6)は、6状態のチューリングマシンが停止するまでに取ることができる最大のステップ数を示しています。最近の発見によると、BB(6)は単に大きいだけでなく、以前の推定をはるかに超えており、新しい下限は10,000,000の10乗を超え、さらには2が2の上に2が上に9まで重ねられたような驚異的な値に達しています。
以前の研究では、BB(5)は47,176,870と定められ、BB(5)とBB(6)の間には大きな複雑さの飛躍があることが示されました。ラフラムは、これらの発見に興奮を覚え、困難な世界の中で研究への情熱が再燃したと述べています。また、nが増加するにつれてBB(n)の値が、集合論の特定の公理から独立する可能性があることについても考えています。
全体として、この投稿は計算の限界を理解する進展と、特定の数学的関数の広がりを強調しており、広い世界で直面している課題と対比しています。
100.実験的X11互換レイヤー(Experimental X11 Compatibility Layer)
Waybackは、ユーザーがWaylandという最新のディスプレイサーバープロトコルを使用して、完全なXデスクトップ環境を実行できる新しい実験的なツールです。これは軽量なコンポジタとして機能し、Xwaylandサーバーを実行するために必要な機能を提供します。最終的には、Alpine Linuxディストリビューションにおける従来のX.orgサーバーを置き換えることを目指しており、Xアプリケーションのメンテナンスを減らすのに役立ちます。
Waybackはまだ実験段階にあるため、バグや頻繁な変更があることをユーザーは覚悟する必要があります。問題が発生した場合は、それを修正し、変更を提出することで協力することが推奨されています。
Waybackをインストールするには、以下の依存関係が必要です。Waylandのコンポーネント(wayland-server、wayland-client、wayland-cursor、wayland-egl)、Waylandプロトコルのバージョン1.14以上、xkbcommon、wlrootsのバージョン0.19です。
Waybackをビルドしてインストールするには、次のコマンドを使用します。最初に「meson setup _build」と入力し、次に「cd _build」でディレクトリを移動します。その後、「meson compile」を実行し、最後に「meson install」でインストールを完了させます。