643131900e7de1b1acb55547c47d260c3d1d882c
[WebKit-https.git] / Source / JavaScriptCore / bytecode / SamplingTool.cpp
1 /*
2  * Copyright (C) 2008, 2009 Apple Inc. All rights reserved.
3  *
4  * Redistribution and use in source and binary forms, with or without
5  * modification, are permitted provided that the following conditions
6  * are met:
7  *
8  * 1.  Redistributions of source code must retain the above copyright
9  *     notice, this list of conditions and the following disclaimer.
10  * 2.  Redistributions in binary form must reproduce the above copyright
11  *     notice, this list of conditions and the following disclaimer in the
12  *     documentation and/or other materials provided with the distribution.
13  * 3.  Neither the name of Apple Computer, Inc. ("Apple") nor the names of
14  *     its contributors may be used to endorse or promote products derived
15  *     from this software without specific prior written permission.
16  *
17  * THIS SOFTWARE IS PROVIDED BY APPLE AND ITS CONTRIBUTORS "AS IS" AND ANY
18  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
19  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
20  * DISCLAIMED. IN NO EVENT SHALL APPLE OR ITS CONTRIBUTORS BE LIABLE FOR ANY
21  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
22  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
23  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
24  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
25  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
26  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
27  */
28
29 #include "config.h"
30 #include "SamplingTool.h"
31
32 #include "CodeBlock.h"
33 #include "Interpreter.h"
34 #include "Opcode.h"
35
36 #if !OS(WINDOWS)
37 #include <unistd.h>
38 #endif
39
40 namespace JSC {
41
42 #if ENABLE(SAMPLING_FLAGS)
43
44 void SamplingFlags::sample()
45 {
46     uint32_t mask = static_cast<uint32_t>(1 << 31);
47     unsigned index;
48
49     for (index = 0; index < 32; ++index) {
50         if (mask & s_flags)
51             break;
52         mask >>= 1;
53     }
54
55     s_flagCounts[32 - index]++;
56 }
57
58 void SamplingFlags::start()
59 {
60     for (unsigned i = 0; i <= 32; ++i)
61         s_flagCounts[i] = 0;
62 }
63 void SamplingFlags::stop()
64 {
65     uint64_t total = 0;
66     for (unsigned i = 0; i <= 32; ++i)
67         total += s_flagCounts[i];
68
69     if (total) {
70         dataLog("\nSamplingFlags: sample counts with flags set: (%lld total)\n", total);
71         for (unsigned i = 0; i <= 32; ++i) {
72             if (s_flagCounts[i])
73                 dataLog("  [ %02d ] : %lld\t\t(%03.2f%%)\n", i, s_flagCounts[i], (100.0 * s_flagCounts[i]) / total);
74         }
75         dataLog("\n");
76     } else
77     dataLog("\nSamplingFlags: no samples.\n\n");
78 }
79 uint64_t SamplingFlags::s_flagCounts[33];
80
81 #else
82 void SamplingFlags::start() {}
83 void SamplingFlags::stop() {}
84 #endif
85
86 #if ENABLE(SAMPLING_REGIONS)
87 volatile uintptr_t SamplingRegion::s_currentOrReserved;
88 Spectrum<const char*>* SamplingRegion::s_spectrum;
89 unsigned long SamplingRegion::s_noneOfTheAbove;
90 unsigned SamplingRegion::s_numberOfSamplesSinceDump;
91
92 SamplingRegion::Locker::Locker()
93 {
94     uintptr_t previous;
95     while (true) {
96         previous = s_currentOrReserved;
97         if (previous & 1) {
98 #if OS(UNIX)
99             sched_yield();
100 #endif
101             continue;
102         }
103         if (WTF::weakCompareAndSwap(&s_currentOrReserved, previous, previous | 1))
104             break;
105     }
106 }
107
108 SamplingRegion::Locker::~Locker()
109 {
110     // We don't need the CAS, but we do it out of an
111     // abundance of caution (and because it gives us a memory fence, which is
112     // never bad).
113     uintptr_t previous;
114     do {
115         previous = s_currentOrReserved;
116     } while (!WTF::weakCompareAndSwap(&s_currentOrReserved, previous, previous & ~1));
117 }
118
119 void SamplingRegion::sample()
120 {
121     // Make sure we lock s_current.
122     Locker locker;
123     
124     // Create a spectrum if we don't have one already.
125     if (!s_spectrum)
126         s_spectrum = new Spectrum<const char*>();
127     
128     ASSERT(s_currentOrReserved & 1);
129     
130     // Walk the region stack, and record each region we see.
131     SamplingRegion* region = bitwise_cast<SamplingRegion*>(s_currentOrReserved & ~1);
132     if (region) {
133         for (; region; region = region->m_previous)
134             s_spectrum->add(region->m_name);
135     } else
136         s_noneOfTheAbove++;
137     
138     if (s_numberOfSamplesSinceDump++ == SamplingThread::s_hertz) {
139         s_numberOfSamplesSinceDump = 0;
140         dumpInternal();
141     }
142 }
143
144 void SamplingRegion::dump()
145 {
146     Locker locker;
147     
148     dumpInternal();
149 }
150
151 void SamplingRegion::dumpInternal()
152 {
153     if (!s_spectrum) {
154         dataLog("\nSamplingRegion: was never sampled.\n\n");
155         return;
156     }
157     
158     Vector<Spectrum<const char*>::KeyAndCount> list = s_spectrum->buildList();
159     
160     unsigned long total = s_noneOfTheAbove;
161     for (unsigned i = list.size(); i--;)
162         total += list[i].count;
163     
164     dataLog("\nSamplingRegion: sample counts for regions: (%lu samples)\n", total);
165
166     for (unsigned i = list.size(); i--;)
167         dataLog("    %3.2lf%%  %s\n", (100.0 * list[i].count) / total, list[i].key);
168 }
169 #else // ENABLE(SAMPLING_REGIONS)
170 void SamplingRegion::dump() { }
171 #endif // ENABLE(SAMPLING_REGIONS)
172
173 /*
174   Start with flag 16 set.
175   By doing this the monitoring of lower valued flags will be masked out
176   until flag 16 is explictly cleared.
177 */
178 uint32_t SamplingFlags::s_flags = 1 << 15;
179
180
181 #if OS(WINDOWS)
182
183 static void sleepForMicroseconds(unsigned us)
184 {
185     unsigned ms = us / 1000;
186     if (us && !ms)
187         ms = 1;
188     Sleep(ms);
189 }
190
191 #else 
192
193 static void sleepForMicroseconds(unsigned us)
194 {
195     usleep(us);
196 }
197
198 #endif
199
200 static inline unsigned hertz2us(unsigned hertz)
201 {
202     return 1000000 / hertz;
203 }
204
205
206 SamplingTool* SamplingTool::s_samplingTool = 0;
207
208
209 bool SamplingThread::s_running = false;
210 unsigned SamplingThread::s_hertz = 10000;
211 ThreadIdentifier SamplingThread::s_samplingThread;
212
213 void* SamplingThread::threadStartFunc(void*)
214 {
215     while (s_running) {
216         sleepForMicroseconds(hertz2us(s_hertz));
217
218 #if ENABLE(SAMPLING_FLAGS)
219         SamplingFlags::sample();
220 #endif
221 #if ENABLE(SAMPLING_REGIONS)
222         SamplingRegion::sample();
223 #endif
224 #if ENABLE(OPCODE_SAMPLING)
225         SamplingTool::sample();
226 #endif
227     }
228
229     return 0;
230 }
231
232
233 void SamplingThread::start(unsigned hertz)
234 {
235     ASSERT(!s_running);
236     s_running = true;
237     s_hertz = hertz;
238
239     s_samplingThread = createThread(threadStartFunc, 0, "JavaScriptCore::Sampler");
240 }
241
242 void SamplingThread::stop()
243 {
244     ASSERT(s_running);
245     s_running = false;
246     waitForThreadCompletion(s_samplingThread, 0);
247 }
248
249
250 void ScriptSampleRecord::sample(CodeBlock* codeBlock, Instruction* vPC)
251 {
252     if (!m_samples) {
253         m_size = codeBlock->instructions().size();
254         m_samples = static_cast<int*>(calloc(m_size, sizeof(int)));
255         m_codeBlock = codeBlock;
256     }
257
258     ++m_sampleCount;
259
260     unsigned offest = vPC - codeBlock->instructions().begin();
261     // Since we don't read and write codeBlock and vPC atomically, this check
262     // can fail if we sample mid op_call / op_ret.
263     if (offest < m_size) {
264         m_samples[offest]++;
265         m_opcodeSampleCount++;
266     }
267 }
268
269 void SamplingTool::doRun()
270 {
271     Sample sample(m_sample, m_codeBlock);
272     ++m_sampleCount;
273
274     if (sample.isNull())
275         return;
276
277     if (!sample.inHostFunction()) {
278         unsigned opcodeID = m_interpreter->getOpcodeID(sample.vPC()[0].u.opcode);
279
280         ++m_opcodeSampleCount;
281         ++m_opcodeSamples[opcodeID];
282
283         if (sample.inCTIFunction())
284             m_opcodeSamplesInCTIFunctions[opcodeID]++;
285     }
286
287 #if ENABLE(CODEBLOCK_SAMPLING)
288     if (CodeBlock* codeBlock = sample.codeBlock()) {
289         MutexLocker locker(m_scriptSampleMapMutex);
290         ScriptSampleRecord* record = m_scopeSampleMap->get(codeBlock->ownerExecutable());
291         ASSERT(record);
292         record->sample(codeBlock, sample.vPC());
293     }
294 #endif
295 }
296
297 void SamplingTool::sample()
298 {
299     s_samplingTool->doRun();
300 }
301
302 void SamplingTool::notifyOfScope(JSGlobalData& globalData, ScriptExecutable* script)
303 {
304 #if ENABLE(CODEBLOCK_SAMPLING)
305     MutexLocker locker(m_scriptSampleMapMutex);
306     m_scopeSampleMap->set(script, adoptPtr(new ScriptSampleRecord(globalData, script)));
307 #else
308     UNUSED_PARAM(globalData);
309     UNUSED_PARAM(script);
310 #endif
311 }
312
313 void SamplingTool::setup()
314 {
315     s_samplingTool = this;
316 }
317
318 #if ENABLE(OPCODE_SAMPLING)
319
320 struct OpcodeSampleInfo {
321     OpcodeID opcode;
322     long long count;
323     long long countInCTIFunctions;
324 };
325
326 struct LineCountInfo {
327     unsigned line;
328     unsigned count;
329 };
330
331 static int compareOpcodeIndicesSampling(const void* left, const void* right)
332 {
333     const OpcodeSampleInfo* leftSampleInfo = reinterpret_cast<const OpcodeSampleInfo*>(left);
334     const OpcodeSampleInfo* rightSampleInfo = reinterpret_cast<const OpcodeSampleInfo*>(right);
335
336     return (leftSampleInfo->count < rightSampleInfo->count) ? 1 : (leftSampleInfo->count > rightSampleInfo->count) ? -1 : 0;
337 }
338
339 #if ENABLE(CODEBLOCK_SAMPLING)
340 static int compareLineCountInfoSampling(const void* left, const void* right)
341 {
342     const LineCountInfo* leftLineCount = reinterpret_cast<const LineCountInfo*>(left);
343     const LineCountInfo* rightLineCount = reinterpret_cast<const LineCountInfo*>(right);
344
345     return (leftLineCount->line > rightLineCount->line) ? 1 : (leftLineCount->line < rightLineCount->line) ? -1 : 0;
346 }
347
348 static int compareScriptSampleRecords(const void* left, const void* right)
349 {
350     const ScriptSampleRecord* const leftValue = *static_cast<const ScriptSampleRecord* const *>(left);
351     const ScriptSampleRecord* const rightValue = *static_cast<const ScriptSampleRecord* const *>(right);
352
353     return (leftValue->m_sampleCount < rightValue->m_sampleCount) ? 1 : (leftValue->m_sampleCount > rightValue->m_sampleCount) ? -1 : 0;
354 }
355 #endif
356
357 void SamplingTool::dump(ExecState* exec)
358 {
359     // Tidies up SunSpider output by removing short scripts - such a small number of samples would likely not be useful anyhow.
360     if (m_sampleCount < 10)
361         return;
362     
363     // (1) Build and sort 'opcodeSampleInfo' array.
364
365     OpcodeSampleInfo opcodeSampleInfo[numOpcodeIDs];
366     for (int i = 0; i < numOpcodeIDs; ++i) {
367         opcodeSampleInfo[i].opcode = static_cast<OpcodeID>(i);
368         opcodeSampleInfo[i].count = m_opcodeSamples[i];
369         opcodeSampleInfo[i].countInCTIFunctions = m_opcodeSamplesInCTIFunctions[i];
370     }
371
372     qsort(opcodeSampleInfo, numOpcodeIDs, sizeof(OpcodeSampleInfo), compareOpcodeIndicesSampling);
373
374     // (2) Print Opcode sampling results.
375
376     dataLog("\nBytecode samples [*]\n");
377     dataLog("                             sample   %% of       %% of     |   cti     cti %%\n");
378     dataLog("opcode                       count     VM        total    |  count   of self\n");
379     dataLog("-------------------------------------------------------   |  ----------------\n");
380
381     for (int i = 0; i < numOpcodeIDs; ++i) {
382         long long count = opcodeSampleInfo[i].count;
383         if (!count)
384             continue;
385
386         OpcodeID opcodeID = opcodeSampleInfo[i].opcode;
387         
388         const char* opcodeName = opcodeNames[opcodeID];
389         const char* opcodePadding = padOpcodeName(opcodeID, 28);
390         double percentOfVM = (static_cast<double>(count) * 100) / m_opcodeSampleCount;
391         double percentOfTotal = (static_cast<double>(count) * 100) / m_sampleCount;
392         long long countInCTIFunctions = opcodeSampleInfo[i].countInCTIFunctions;
393         double percentInCTIFunctions = (static_cast<double>(countInCTIFunctions) * 100) / count;
394         debugDebugPrintf("%s:%s%-6lld %.3f%%\t%.3f%%\t  |   %-6lld %.3f%%\n", opcodeName, opcodePadding, count, percentOfVM, percentOfTotal, countInCTIFunctions, percentInCTIFunctions);
395     }
396     
397     dataLog("\n[*] Samples inside host code are not charged to any Bytecode.\n\n");
398     dataLog("\tSamples inside VM:\t\t%lld / %lld (%.3f%%)\n", m_opcodeSampleCount, m_sampleCount, (static_cast<double>(m_opcodeSampleCount) * 100) / m_sampleCount);
399     dataLog("\tSamples inside host code:\t%lld / %lld (%.3f%%)\n\n", m_sampleCount - m_opcodeSampleCount, m_sampleCount, (static_cast<double>(m_sampleCount - m_opcodeSampleCount) * 100) / m_sampleCount);
400     dataLog("\tsample count:\tsamples inside this opcode\n");
401     dataLog("\t%% of VM:\tsample count / all opcode samples\n");
402     dataLog("\t%% of total:\tsample count / all samples\n");
403     dataLog("\t--------------\n");
404     dataLog("\tcti count:\tsamples inside a CTI function called by this opcode\n");
405     dataLog("\tcti %% of self:\tcti count / sample count\n");
406     
407 #if ENABLE(CODEBLOCK_SAMPLING)
408
409     // (3) Build and sort 'codeBlockSamples' array.
410
411     int scopeCount = m_scopeSampleMap->size();
412     Vector<ScriptSampleRecord*> codeBlockSamples(scopeCount);
413     ScriptSampleRecordMap::iterator iter = m_scopeSampleMap->begin();
414     for (int i = 0; i < scopeCount; ++i, ++iter)
415         codeBlockSamples[i] = iter->second.get();
416
417     qsort(codeBlockSamples.begin(), scopeCount, sizeof(ScriptSampleRecord*), compareScriptSampleRecords);
418
419     // (4) Print data from 'codeBlockSamples' array.
420
421     dataLog("\nCodeBlock samples\n\n"); 
422
423     for (int i = 0; i < scopeCount; ++i) {
424         ScriptSampleRecord* record = codeBlockSamples[i];
425         CodeBlock* codeBlock = record->m_codeBlock;
426
427         double blockPercent = (record->m_sampleCount * 100.0) / m_sampleCount;
428
429         if (blockPercent >= 1) {
430             //Instruction* code = codeBlock->instructions().begin();
431             dataLog("#%d: %s:%d: %d / %lld (%.3f%%)\n", i + 1, record->m_executable->sourceURL().utf8().data(), codeBlock->lineNumberForBytecodeOffset(0), record->m_sampleCount, m_sampleCount, blockPercent);
432             if (i < 10) {
433                 HashMap<unsigned,unsigned> lineCounts;
434                 codeBlock->dump(exec);
435
436                 dataLog("    Opcode and line number samples [*]\n\n");
437                 for (unsigned op = 0; op < record->m_size; ++op) {
438                     int count = record->m_samples[op];
439                     if (count) {
440                         dataLog("    [% 4d] has sample count: % 4d\n", op, count);
441                         unsigned line = codeBlock->lineNumberForBytecodeOffset(op);
442                         lineCounts.set(line, (lineCounts.contains(line) ? lineCounts.get(line) : 0) + count);
443                     }
444                 }
445                 dataLog("\n");
446
447                 int linesCount = lineCounts.size();
448                 Vector<LineCountInfo> lineCountInfo(linesCount);
449                 int lineno = 0;
450                 for (HashMap<unsigned,unsigned>::iterator iter = lineCounts.begin(); iter != lineCounts.end(); ++iter, ++lineno) {
451                     lineCountInfo[lineno].line = iter->first;
452                     lineCountInfo[lineno].count = iter->second;
453                 }
454
455                 qsort(lineCountInfo.begin(), linesCount, sizeof(LineCountInfo), compareLineCountInfoSampling);
456
457                 for (lineno = 0; lineno < linesCount; ++lineno) {
458                     dataLog("    Line #%d has sample count %d.\n", lineCountInfo[lineno].line, lineCountInfo[lineno].count);
459                 }
460                 dataLog("\n");
461                 dataLog("    [*] Samples inside host code are charged to the calling Bytecode.\n");
462                 dataLog("        Samples on a call / return boundary are not charged to a specific opcode or line.\n\n");
463                 dataLog("            Samples on a call / return boundary: %d / %d (%.3f%%)\n\n", record->m_sampleCount - record->m_opcodeSampleCount, record->m_sampleCount, (static_cast<double>(record->m_sampleCount - record->m_opcodeSampleCount) * 100) / record->m_sampleCount);
464             }
465         }
466     }
467 #else
468     UNUSED_PARAM(exec);
469 #endif
470 }
471
472 #else
473
474 void SamplingTool::dump(ExecState*)
475 {
476 }
477
478 #endif
479
480 } // namespace JSC